'-'/ 


,  Aecemeinent 


Canada  1986 


Donnas  de  cataiogage  avant  publication  (Canada) 

Vedette  principals  au  titre: 

Guide  a  1' intention  des  utilisateurs  sur  la  qualite  des 
donnees  du  recensement  de  1986  :  echantillonnage  et 
ponderation 

(Reference) 

(Census  Canada,  1986  -  Recensement  Canada,  1986) 

Publie  aussi  en  anglais  sous  le  titre:  User's  guide  to 

the  quality  of  1986  census  data,  sampling  and  weighting. 

ISBN  0-660-92752-7 

CS99-136F 

1.  Canada  —  Recensement,  1986  —  Methodologie .  2. 
Canada  —  Recensement,  1986  —  Evaluation.  I.  Statistics 
Canada.  II.  Titre:  User's  guide  to  the  quality  of  1986 
census  data,  sampling  and  weighting.  III.  Collection: 
Reference.  IV.  Collection:  Census  Canada,  1986  - 
Recensement  Canada,  1986. 

HA741.5.1986  U831A  1990   304. 6 '0723  C90-098028-1 


■  ^1     StatJstique  Statistics 


Canada       Canada 


Recensement 
Census 

Canada  1986 
Reference 


GUIDE  A  L'INTENTION 

DES  UTILISATEURS 

SUR  LA  QUALITE  DES  DONNEES 

DU  RECENSEMENT  DE  1986: 

ECHANTILLONNAGE  ET 
PONDERATION 


Publication  autorisee  par  le  ministre  de  I'lndustrie,  des 
Sciences  et  de  la  Technologie 

Tous  droits  reserves.  II  est  interdit  de  reproduire  ou  de 
transmettre  le  contenu  de  la  presente  publication,  sous 
quelque  forme  ou  par  quelque  moyen  que  ce  soil, 
enregistrement  sur  support  magnetique,  reproduction 
electronique,  mecanique,  photographique,  ou  autre,  ou  de 
remmagasiner  dans  un  systeme  de  recouvrement,  sans 
I'autorisation  ecrite  prealable  du  Ministre  des 
Approvisionnements  et  Services  Canada. 


Octobre  1990 

Prix:  Canada,  $23.00 
Autres  pays,    $24.00 

Catalogue  99-1 36F 

ISBN-0-660-92752-7 

Ottawa 


This  publication  is  available  in  English  upon 
request  (Catalogue  No.  99-1 36E). 


Donnas  de  cataiogage  avant  publication  (Canada) 

Vedette  principale  au  titre: 

Guide  a  1' intention  des  utilisateurs  sur  la  qualite  des 
donnees  du  recensement  de  1986  :  echantillonnage  et 
ponderation 

(Reference) 

(Census  Canada,  1986  -  Recensement  Canada,  1986) 

Publie  aussi  en  anglais  sous  le  titre:  User's  guide  to 

the  quality  of  1986  census  data,  sampling  and  weighting. 

ISBN  0-660-92752-7 

CS99-136F 

1.  Canada  —  Recensement,  1986  —  Methodologie .  2. 
Canada  —  Recensement,  1986  —  Evaluation.  I.  Statistics 
Canada.  II.  Titre:  User's  guide  to  the  quality  of  1986 
census  data,  sampling  and  weighting.  III.  Collection: 
Reference.  IV.  Collection:  Census  Canada,  1986  ■ 
Recensement  Canada,  1986. 

HA741.5.1986  U8314  1990   304.6'0723  C90-098028-1 


REMERCIEMENTS 

Ce  document  a  6t6  pr6par6  par  Stephen  Rathwell  de  la  Division  des  M6thodes  d'Enquetes 
Sociales. 

L'auteur  aimerait  remercier  Mike  Banl<ier,  Pierre  Daoust,  Yves  B6land,  Don  Royce,  et  Dick  Carter 
de  la  Sous-Division  des  M6thodes  de  Recensement  et  Recherches  pour  leur  participation  k 
r6laboration  de  ce  docunnent. 

L'auteur  voudrait  6galennent  remercier  Louise  Whalen  et  Lorna  Bailie  de  la  Division  des 
Operations  du  Recensement  pour  leur  contribution. 

Certaines  parties  de  ce  document,  plus  sp6cialement  dans  ies  trois  premiers  chapitres, 
proviennent  de  la  publication  Quality  des  donn6s,  S6rie  1 :  Sources  d'erreurs  -  Echantillonnage 
et  pond6ration,  du  Recensement  de  1976.  Ce  document  avait  6t6  pr6par6  k  i'^poque  par 
Gordon  Brackstone. 


TABLE  DES  MATIERES 

Page 

I.  Introduction    1 

II.  Application  de  I'^chantillonnage  lors  de  recensennents  Canadians 2 

III.  Estimations  bas6es  sur  I'^chantillon  du  recensement 7 

IV.  Programme  d'6valuation  de  I'^chantiilonnage  et  de  la  pond6ration   13 

V.  Biais  d'6chantillonnage 15 

VI.  Evaluation  des  m6thodes  de  pond6ration 19 

VII.  Examen  de  la  coherence  entre  les  estimations-6chantillon  et 

les  chiffres  de  population 26 

VIII.  Variance  d'6chantillonnage  36 

IX.  Conclusion 47 

Annexe:  Matrices  de  pond6ration  k  classement  recoup^ 49 

R6f6rences    53 

Liste  des  tableaux 

1 .  Estimations-6chantillon  (pond6ration  simple)  moins  la 
population  totale  k  I'echelle  nationale  (SD  6chantillonn§s 
seulement)  et  le  pourcentage  de  DR  oCi  il  y  a  surrepr^sentation 

des  caract§ristiques   16 

2.  Mesure  dans  laquelle  les  regions  de  pond6ration  respectent 

les  diverses  limites  g6ographiques 20 

3.  Gentiles  des  6carts  entre  les  estimations-6chantillon  et  les 

chiffres  de  population  des  DR  (en  termes  de  pourcentages  des  chiffres 

de  la  population)  et  pourcentages  des  DR  oCi  il  y  a  r6duction  des  6carts     ...       28 

4.  Gentiles  des  6carts  entre  les  estimations-6chantillon  et  les 

chiffres  de  population  des  SDR  (en  termes  de  pourcentages  des  chiffres 

de  la  population)  et  pourcentages  des  SDR  ou  il  y  a  reduction  des  hearts    .  .      30 

5.  Gentiles  des  6carts  entre  les  estimations-6chantillon  et  les 

chiffres  de  population  des  SR  (en  termes  de  pourcentages  des  chiffres 

de  la  population)  et  pourcentages  des  SR  ou  il  y  a  reduction  des  6carts     ...      31 


TABLE  DES  MATIERES  -  fin 

Page 

6.  Gentiles  des  hearts  entre  las  estimations-^cliantillon  et  les 

chiffres  de  population  des  SRP  (en  termes  de  pourcentages  des  chiffres 

de  la  population)  et  pourcentages  des  SRP  ou  il  y  a  reduction  des  hearts     . .      32 

7.  Pourcentage  de  tous  les  SD  ^chantillonn^s  au  Canada  dont  le 
chiffre  de  population  exc^de  50  et  ou  les  hearts  obtenus 

par  la  MIQ  ^talent  inf^rieurs  ^  ceux  obtenus  k  partir  des 

coefficients  de  pond6ration  simples 33 

8.  Estimations  non  ajust6es  de  I'erreur-type  des  estimations-6chantillon    38 

9.  Facteurs  d'ajustement  de  I'erreur-type  au  niveau  national  ou  provincial 
et  centiles  des  facteurs  au  niveau  de  la  region  de 

pond6ration  (RP)    39 

Ljste  des  figures 

1 .  Ecart  selon  les  lignes  de  la  matrice  de  ponderation  des  manages 23 

2.  Pourcentage  de  la  population  par  ligne  de  la  matrice  de  ponderation 

des  manages 23 

3.  Pourcentage  des  RP  pour  lesquelles  les  lignes  de  la 

matrice  de  pond6ration  des  manages  ont  6t6  cpmbin6es 24 

4.  Fraction  d'^chantillonnage  selon  les  lignes  de  la 

matrice  de  pond6ration  des  manages   24 


- 1  - 

I.   INTRODUCTION 

De  nos  jours,  I'^chantillonnage  constitue  une  technique  largement  utilis6e  dans  maints 
domaines.  Nous  pouvons  juger  de  la  quality  d'un  produit  k  I'aide  d'un  echantillon  avant  d'en 
faire  I'achat;  nous  nous  formons  une  opinion  des  gens  k  partir  d'6chantillons  de  leur 
comportement;  nos  impressions  sur  tel  pays  ou  telle  ville  sont  basees  sur  les  courts  voyages 
que  nous  y  avons  faits.  Ce  sont  1^  des  exemples  d'6chantillonnage  menant  k  tirer  des 
conclusions  sur  le  "tout"  k  partir  de  connaissances  portant  sur  une  "partie". 

Scientifiquement  parlant,  I'^chantiilonnage  est  utilis6  par  les  comptables,  par  exemple,  lorsqu'ils 
effectuent  la  verification  des  6tats  financiers;  dans  I'industrie,  pour  verifier  la  quality  d'articles 
produits  en  s6rie,  et  par  les  initiateurs  de  sondages  d'opinion  et  d'enquetes  pour  recueillir  des 
renseignements  sur  la  fagon  de  penser  ou  les  caract6ristiques  d'une  population  donn6e.  On  a 
g§n§ralement  recours  k  I'^chantillonnage  pour  reduire  les  couts  d'enquete  ou  pour  obtenirfj 
rapidement  des  donn^es,  ou  les  deux.  Dans  certains  cas,  le  mesurage  peut  meme  d6truire  le 
produit  k  r6tude  (par  exemple,  revaluation  de  la  dur6e  de  vie  des  ampoules  6lectriques)  et  par 
consequent,  rechantillonnage  s'avere  essentiel.  Le  d6savantage  de  cette  methode  est  que  les 
resultats  obtenus  k  partir  d'un  echantillon  peuvent  ne  pas  etre  aussi  precis  que  ceux  recueillis 
aupres  de  la  population  totale.  Toutefois,  rechantillonnage  peut  etre  avantageux  quand  la  perte 
de  precision  (qui  peut  etre  minime  si  I'echantillon  est  suffisamment  grand)  est  acceptable  en 
fonction  de  I'utilisation  prevue  des  resultats.  De  plus,  la  reduction  de  I'envergure  d'une  etude 
faite  k  partir  d'un  echantillon  peut  mener  k  la  reduction  des  erreurs  non  dues  k  \\ 
I'echantillonnage,  ce  qui  compense  en  partie  le  manque  de  precision  attribuable  k 
rechantillonnage. 

Pour  le  recensement  de  la  population  de  1986,  on  a  applique  les  methodes  d'echantillonnage 
de  plusieurs  fagons.  On  y  a  eu  recours  pour  s'assurer  que  la  qualite  du  travail  des  representants 
du  recensement  dans  le  cadre  de  la  collecte  des  questionnaires  respectait  certaines  normes;  on 
y  a  eu  recours  pour  le  controle  qualitatif  du  codage  des  reponses  au  cours  du  depouillement 
dans  les  bureaux  r6gionaux;  on  y  a  eu  recours  pour  estimer  le  sous-denombrement  et  le 
surdenombrement  qui  se  sont  produits  pour  diverses  raisons;  on  y  a  eu  recours  pour  evaluer 
la  qualite  des  donnees  du  recensement.  Toutefois,  la  principale  application  de  rechantillonnage 
au  recensement  a  ete  effectuee  pendant  le  denombrement  sur  le  terrain  ou  toutes  les  donnees, 
excepte  les  donnees  de  base,  ont  ete  recueillies  aupr6s  d'un  echantillon  de  menages.  Le 
present  guide  d6crit  cette  derni6re  utilisation  de  rechantillonnage  et  presente  une  evaluation  de 
I'incidence  de  cette  methode  sur  la  qualite  des  donnees  du  recensement. 

Le  chapitre  II  fait  I'historique  de  I'application  des  methodes  d'6chantillonnage  aux  recensements 
canadiens  et  decrit  celles  qui  ont  ete  utilisees  au  recensement  de  1986.  Le  chapitre  III  decrit  les 
methodes  de  ponderation  des  donnees-echantillon  utilisees  en  vue  d'obtenir  des  estimations  k 
rechelle  de  la  population  totale  et  explique  les  considerations  d'ordre  pratique  et  theorique  qui 
r6gissent  le  choix  de  ces  methodes.  On  pr6sente  au  chapitre  IV  les  etudes  effectuees  dans  le 
cadre  du  programme  d'evaluation  des  methodes  d'echantillonnage  et  de  ponderation  utilisees 
au  recensement  de  1986.  Les  chapitres  V  k  VIII  donnent  les  resultats  de  ces  etudes. 
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II.  APPUCATION  DE  L'ECHANTILLONNAGE  LORS  DE  RECENSEMENTS  CANADIENS 

Dans  un  recensement  de  la  population,  I'^chantillonnage  conslste  k  recueillir  et  k  trailer 
certaines  caract^ristiques  ei  partir  d'un  ^chantillon  al^atoire  de  logennents  et  de  personnes 
d§nombr6s  lors  du  recensement  Integral.  On  obtient  ensuite  pour  I'ensennble  de  la  population 
les  totaux  pour  ces  caract^ristiques  en  pond^rant  les  donn^es-^chantillon.  Les  caract^ristiques 
recueillies  pour  tous  les  logements  ou  toutes  les  personnes  faisant  partie  du  recensement  sont 
appel^es  "caract^ristiques  de  base",  tandis  que  les  caract^ristiques  recueillies  k  partir  d'un 
^chantillon  sont  appel^es  'caract^ristiques-^chantillon". 

A.  Historique  de  rdchantilionnaqe  au  recensement  canadien^ 

L'^chantillonnage  a  §t6  utilise  pour  la  premiere  fois  au  cours  du  recensement  de  1941.  Un 
questionnaire  sur  le  logement  a  6t^  remis  k  tous  les  10  logements  de  chaque  sous-district 
de  recensement.  Les  reponses  aux  27  questions  de  ce  questionnaire  ont  6t6  int^gr^es  k 
celles  du  questionnaire  sur  la  population  et  les  manages  correspondant  k  ces  logements, 
ce  qui  a  permis  de  faire  le  recoupement  des  caract^ristiques-^chantillon  et  des 
caract^ristiques  de  base.  Lors  de  be  meme  recensement,  on  a  utilise  I'^chantillonnage  au 
cours  de  I'^tape  du  depouillement  pour  obtenir  des  estimations  provisoires  du  revenu  des 
salaries,  de  la  repartition  de  la  population  active  selon  I'Sge  et  de  la  composition  des  families 
au  Canada.  Dans  ce  cas,  I'^chantillon  6tait  constitu^  du  dixi^me  de  tous  les  secteurs  de 
d^nombrement  du  Canada  et  tous  les  questionnaires  sur  la  population  de  ces  secteurs  ont 
6te  d§pouill§s  k  I'avance. 

L'6chantillonnage  a  6galement  6t6  utilise  pour  le  recensement  du  logement  de  1951.  Cette 
fois,  on  a  choisi  chaque  cinqui^me  logement  (ceux  dont  le  num^ro  d'identification  se 
terminait  par  2  ou  par  7)  et  le  questionnaire  sur  le  logement  comportait  24  questions.  Au 
cours  du  recensement  de  1961,  on  a  pr6lev6  un  6chantillon  de  20%  des  manages  priv6s  et 
on  a  demand^  aux  membres  de  15  ans  et  plus  de  ces  manages  de  remplir  un  questionnaire- 
^chantillon  sur  la  population  compbrtant  des  questions  sur  la  migration  interne,  la  f^condit^ 
et  le  revenu.  La  m^thode  de  T^chantillonnage  n'a  pas  6te  utilis^e  au  cours  des 
recensements  de  moindre  envergure  de  1956  et  1966. 

Plusieurs  innovations  importantes  ont  6t6  apport6es  aux  m6thodes  de  recensement  en  1971 . 
La  premiere  a  ^t^  i' utilisation  de  I'autod^nombrement  pour  la  majority  de  la  population  au 
lieu  de  la  m^thode  traditionnelle  de  recensement  par  repr^sentant.  Ce  changement  d^coule 
des  r^sultats  de  plusieurs  Etudes  effectu^es  au  Canada  et  ailleurs  (Fellegi.  1964,  Hansen  et 
associ^s,  1959)  selon  lesquels  la  presence  d'un  representant  avait  un  effet  important  sur  la 
variance^  des  chiffres  du  recensement.  On  pr6voyait  que  rautod6nombrement  permettrait 


Des  renseignements  detailles  sur  les  recensements  particuliers  sont 
contenus  dans  le  rapport  administratif ,  la  revue  generale,  le  guide 
sonunaire  ou  le  recensement  en  bref  des  recensements  en  question.  Ces 
rapports  sont  mentionnes  a  la  fin  de  ce  guide. 

La  "variance"  d'une  estimation  est  une  mesure  de  sa  precision.  La 
variance  est  expliquee  plus  en  detail  au  chapitre  VIII. 


-3- 

de  r^duire  la  variance  des  chiffres  du  recensement  attribuable  k  la  presence  du  repr^sentant 
et,  en  m§me  temps,  donneralt  au  r^pondant  le  tennps  voulu  pour  remplir  le  questionnaire  k 
son  aise;  par  consequent,  on  pouvait  s'attendre  que  les  r^ponses  seraient  plus  exactes  que 
par  le  pass6. 

Un  autre  changenrient  sun/enu  dans  le  recensement  de  1971  a  6t6  la  modification  du 
contenu.  Le  nombre  de  sujets  trait^s  et  de  questions  poshes  ^tait  plus  ^lev^  qu'aux 
recensements  precedents.  Une  etude  des  couts,  du  fardeau  du  repondant  et  des  deiais  de 
production  par  rapport  k  la  qualite  des  donnees  dans  le  cadre  d'un  recensement  par 
echantillonnage  et  par  autodenombrement  a  preside  k  la  decision  de  recueillir  toutes  les 
donnees,  sauf  celles  portant  sur  quelques  caracteristiques  de  base,  aupres  d'un  6chantillon 
d'un  tiers  de  la  population  au  recensement  de  1971.  Sauf  dans  les  regions  les  plus  isoiees 
du  Canada,  le  tiers  des  m6nages  priv6s  a  regu  le  questionnaire  complet  comportant  toutes 
les  questions  du  recensement,  tandis  que  le  reste  des  menages  a  regu  le  questionnaire 
abrege  qui  ne  contenait  que  les  questions  de  base  soit  le  nom,  le  lien  de  parente  avec  le 
chef  de  menage,  le  sexe,  la  date  de  naissance,  I'etat  matrimonial,  la  langue  maternelle,  le 
type  de  logement,  le  mode  d'occupation,  le  nombre  de  pieces,  I'alimentation  en  eau,  les 
toilettes  ainsi  que  certaines  questions  en  rapport  avec  la  couverture  du  recensement.  Tous 
les  menages  vivant  dans  des  regions  predesignees  et  dans  des  logements  collectifs^  ont 
regu  le  questionnaire  complet.  Le  rapport  statistique  "Sampling  in  the  Census"  (Bureau 
federal  de  la  statistique  (1968))  donne  une  description  detainee  des  projets  d'application  de 
cette  methode  au  recensement  de  1971. 

Le  contenu  du  recensement  de  1976  etait  beaucoup  moindre  que  celui  de  1971.  En  outre, 
le  questionnaire  de  1976  ne  contenait  pas  les  questions  qui  posent  le  plus  de  difficulte  k 
recueillir,  par  exemple,  les  questions  sur  le  revenu,  ni  celles  dont  les  frais  de  codage  sont 
les  plus  eiev6s,  par  exemple,  celles  sur  la  profession,  I'activite  economique,  et  le  lieu  de 
travail.  Par  consequent,  les  avantages  de  rechantillonnage  par  rapport  aux  couts  et  k 
I'aliegement  du  fardeau  du  repondant  etaient  moins  evidents  qu'au  recensement  de  1971. 
Neanmoins,  apr6s  avoir  evalu6  les  economies  eventuelles  reli6es  k  divers  taux 
d'6chantillonnage  et  6tudi6  les  consequences  sur  le  plan  des  relations  publiques  du  retour 
au  denombrement  integral,  il  a  et6  decide  d'appliquer  en  1976  la  meme  methode 
d'6chantillonnage  qu'en  1971. 

Au  recensement  de  1981,  on  a  utilise  la  plupart  des  m§mes  methodes  qu'en  1971  et  1976, 
sauf  que  le  taux  d'echantillonnage  est  passe  du  tiers  au  cinquieme  des  menages.  Les 
etudes  realisees  k  cette  epoque  ont  reveie  que  la  diminution  consecutive  de  la  qualite  des 
donnees  (mesuree  au  moyen  de  la  variance)  serait  acceptable  et  qu'elle  ne  serait  pas 
suffisamment  importante  pour  annuler  les  avantages  decoulant  de  la  reduction  des  couts  et 
du  fardeau  du  repondant,  ainsi  que  la  diminution  des  deiais  de  production  (voir  Royce, 


Un  logement  collectif  est  une  institution  ou  un  etablissement  commercial 
ou  communautaire ,  par  exemple  les  hotels,  les  hopitaux,  les  residences 
de  personnel,  et  les  camps  de  chantier. 


1983).  Douze  questions  ont  6t6  pos6es  k  I'ensemble  de  la  population  et  34  questions  de 
plus  ont  6t6  poshes  aux  membres  de  r^chantillon. 

Le  recensement  de  1986  a  6t6  le  premier  recensement  majeur  r6alis6  au  milieu  d'une 
d6cennie.  II  avait  6t6  d6cid6  que  seul  un  recensement  majeur  pourrait  r6pondre  aux  besoins 
croissants  en  mati6re  de  donn6es  locales  sur  le  march6  du  travail,  besoins  rendus  plus 
pressants  par  I'importante  recession  (1981-1982)  survenue  depuis  le  recensement  pr6c6dent. 
Toutefois,  afin  de  maintenir  les  coOts  d'6laboration  au  niveau  le  plus  bas  possible,  on  a 
d6cid6  de  faire  tr6s  peu  de  changements.  Par  consequent,  les  questions  ainsi  que  les 
m6thodes  de  collecte  et  de  d6pouillement  des  donn6es  du  recensement  de  1981  ont  6t6 
reprises,  sauf  lorsque  nous  avions  des  raisons  importantes  de  ne  pas  proc6der  ainsi.  Des 
questions  portant  sur  huit  sujets  pos6es  au  recensement  de  1981  n'ont  pas  6t6  reprises  en 
1986,  tandis  que  trois  nouvelles  questions  ont  6t6  ajout6es. 

B.  Plan  d'6chantillonnaae  utilis6  lors  du  Recensement  de  1986 

Le  jour  du  recensement  en  1986,  une  multitude  de  renseignements  ont  6t6  recueillis  aupr6s 
de  chaque  canadien.  La  majeure  partie  de  ces  informations  ont  6t6  obtenues  ^  partir  d'un 
6chantillon.  Dans  chaque  secteur  d'autod6nombrement,  1  logement  priv6  occup6  sur  5  a 
6te  choisi  pour  r§pondre  au  questionnaire  complet  (questionnaire  2B)  contenant  toutes  les 
questions  du  recensement,  k  savoir  neuf  questions  de  base  sur  I'&ge,  le  sexe,  l'6tat 
matrimonial,  la  langue  maternelle,  le  lien  de  parente  avec  la  personne  rep6re  du  manage 
(personne  1),  le  genre  de  logement,  le  mode  d'occupation;  quatre  questions  de  plus  sur  le 
logement  et  19  questions  de  nature  socio-6conomique.  Le  reste  des  manages  priv6s  a  regu 
un  questionnaire  abr6g6  (questionnaire  2A)  contenant  seulement  les  neuf  questions  de  base. 

Tous  les  logements  se  trouvant  dans  les  secteurs  d6nombr6s  par  un  recenseur 
(g6n6ralement  les  regions  6loign6es  ou  les  reserves  indiennes)  ont  regu  le  questionnaire  2B. 
Tous  les  logements  collectifs  ont  aussi  regu  le  questionnaire  2B.  Toutefois,  les  personnes 
decrites  ci-apr6s  habitant  dans  des  logements  collectifs  n'ont  pas  eu  h  r6pondre  au 
questionnaire-6chantillon: 

(a)  les  detenus  dans  les  6tablissements  de  correction,  les  6tablissements  p6nitentiaires  ou 
les  prisons; 

(b)  les  patients  dans  les  hopitaux  g6neraux,  les  centres  de  soins  sp6ciaux,  les 
6tablissements  pour  personnes  ag6es  et  malades  chroniques,  ou  les  hopitaux 
psychiatriques; 

(c)  les  enfants  dans  les  orphelinats  et  foyers  pour  enfants  ou  les  6tablissements  pour  jeunes 
d^linquants. 

Les  canadiens  post6s  k  I'ext^rieur  du  Canada  (g6n6ralement  le  personnel  des  ambassades 
ou  des  forces  arm6es)  ont  regu  un  questionnaire  2C  qui  contenait  les  memes  questions  que 
le  questionnaire  28,  k  I'exclusion  de  celles  portant  sur  le  logement.  Toutefois,  ce 
questionnaire  comportait  des  questions  sur  le  lieu  habituel  de  residence  de  la  personne  au 
Canada.  Les  renseignements  relatifs  aux  logements  priv6s  inoccup6s  ont  6t6  consign6s  sur 
le  questionnaire  2A. 


D'apr6s  les  procedures  de  livraison,  le  repr6sentant  du  recensement  (RR)  devait  planifier  un 
itin6raire  couvrant  tous  les  logements  de  son  secteur  de  d6nombrement  (SD)  puis  se  rendre 
k  chaque  logement  et  y  laisser  un  questionnaire.  Le  choix  de  i'6chantillon,  c'est-^-dire  la 
decision  quant  au  genre  de  questionnaire  k  laisser  dans  chaque  logement  occup6,  a  6t6  fait 
k  partir  du  registre  des  visites  (RV)  dans  lequel  le  RR  inscrivait  tous  les  logements  de  son 
secteur.  Chaque  cinquidme  ligne  du  registre  6tait  ombr6e,  indiquant  qu'un  questionnaire  2B 
devait  §tre  Iaiss6.  Un  point  de  d6part  al6atoire  a  §t§  d6termin6  k  partir  de  la  premiere  ligne 
du  RV,  le  RR  sautait  z6ro,  une,  deux,  trois  ou  quatre  lignes  selon  que  le  cinqui6me, 
quatri6me,  troisidme,  deuxidme  ou  premier  logement  du  SD  devait  §tre  le  premier  k  recevoir 
le  questionnaire  complet.  Par  la  suite,  chaque  logement  inscrit  sur  une  ligne  ombr6e  recevait 
automatiquement  le  questionnaire  complet.  Ces  procedures  6taient  expliqu6es  dans  le 
manuel  du  RR  et  une  attention  particulidre  y  6tait  port6e  pendant  la  formation  du  RR  afin  de 
minimiser  tout  risque  d'erreur  dans  la  selection  de  r6chantillon. 

Dans  la  terminologie  de  rechantillonnage,  rechantiilon  est  d6fini  comme  un  6chantillon  il 
stratifie  avec  selection  systematique  de  logements  prives  occupes,  choisi  en  fonction  d'un 
taux  d'echantillonnage  constant  de  1  sur  5  dans  toutes  les  strates  (SD).  Dans  le  cas  de 
rechantillon  de  personnes,  il  peut  etre  defini  comme  etant  un  echantillon  stratifie  avec 
selection  systematique  de  grappes,  un  logement  constituent  une  grappe.  Stuart  (1976)  et 
Cochran  (1977)  donnent  une  description  detailiee  des  concepts  et  de  la  terminologie  se 
rapportant  k  rechantillonnage. 

C.  Traltement  des  donnees  de  rechantillon  du  Recensement 

Apres  que  le  RR  eut  regu  le  questionnaire  rempli  (2A  ou  2B)  de  chaque  logement  de  son 
secteur  et  que  ce  travail  eut  ete  approuve,  les  questionnaires  ont  ete  envoyes  k  I'un  des  sept 
sites  de  depouillement  r6gionaux  aux  fins  du  traltement  manuel.  Les  donnees  completes 
pour  chaque  SD  ont  ete  saisies  et  stockees  sur  rubans  magnetiques.  Les  questionnaires  et 
les  rubans  magnetiques  ont  ensuite  ete  envoyes  au  bureau  central,  k  Ottawa,  ou  ont  ete 
effectuees  par  ordinateur  des  verifications  afin  de  deceler  dans  les  donnees  des 
incoherences  qui  ne  pourraient  etre  corrigees  que  par  un  examen  manuel  du  questionnaire. 
Une  fois  terminees  toutes  les  mises  k  jour  des  donnees  pour  un  SD,  les  donnees  etaient 
restructurees  et  transferees  k  la  section  Controle  et  Imputation. 

Les  donnees  ont  ete  chargees  dans  10  bases  de  donn6es  de  Contrdle  et  Imputation, 
organis6es  par  donn6es  2A  (100%)  et  2B  (20%)  pour  chacune  des  5  regions.  Les  bases  de 
donnees  2A  contenaient  les  caracteristiques  demographiques  de  base  pour  I'ensemble  de 
la  population  et  les  bases  de  donnees  28  contenaient  les  donnees  pour  les  questions- 
echantillon.  Les  donnees  ont  ete  soumises  k  une  serie  de  modules  de  traltement 
specialises,  ou  tous  les  probiemes  lies  k  des  donnees  incoherentes,  incompatibles,  et 
manquantes  ont  ete  resolus.  Les  bases  de  donnees  2A  ont  ete  traitees  en  premier  et  ont 
donne  lieu  k  la  creation  de  la  base  de  donnees  d'extraction  2A  definitive. 

Une  fois  la  derniere  main  mise  aux  donnees  integrales,  les  reponses  du  questionnaire- 
echantillon  ont  ete  traitees.  Les  enregistrements  2B  pour  lesquels  il  y  a  eu  non  reponse  ont 
ete  enlev6s  des  bases  de  donnees  2B.  Une  base  de  donnees  d'extraction  28  definitive  a  ete 
creee.  Cette  base  de  donn6es  contenait  k  la  fois  les  donnees  integrates  et  les  donnees- 
echantillon  uniquement  pour  les  menages  et  les  personnes  de  i'echantillon.  Les  coefficients 


de  pond^ration  calculus  k  I'aide  des  donn^es  integrates  (tels  que  d^crits  au  chapitre  III)  ont 
et6  charges  dans  cette  base  de  donn^e. 
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III.   ESTIMATIONS  BASEES  SUR  L'ECHANTILLON  DU  RECENSEMENT 

Tout  6chantillonnage  n6cessite  rapplication  d'une  methode  d'estimation  pour  ponderer  les 
donn6es-6chantillon  en  vue  d'obtenir  des  estimations  k  I'^chelle  de  la  population  totale.  La 
m§thode  d'estimation  est  g6n6ralement  choisie  en  fonction  d'exigences  d'ordre  pratique  et 
th6orique.  Sur  le  plan  pratique,  cette  methode  doit  etre  compatible  avec  le  syst^me  det| 
d6pouillement  auquel  elle  s'int6gre,  tandis  que  sur  le  plan  th6orique,  elle  doit  minimiser  rerreurj/ 
des  estimations  due  k  r6chantillonnage.  Les  deux  sections  qui  suivent  d6crivent  les 
considerations  pratiques  et  th6oriques  qui  r6gissent  le  choix  des  m6thodes  d'estimation  k  partir 
de  r6chantillon  du  recensement. 

A.  Considerations  d'ordre  pratique 

Une  m6thode  d'estimation  peut  etre  d^crite  math6matiquement  k  I'aide  d'une  formule 
alg6brique  qui  indique  comment  la  valeur  de  I'estimateur  de  la  population  est  calcul6e  en 
fonction  des  valeurs  obsen/6es  dans  I'^chantillon.  Quand  il  s'agit  de  petites  enquetes  qui 
ne  portent  que  sur  une  ou  deux  caracteristiques,  ou,  lorsque  la  formule  d'estimation  est  tr6s 
simple,  il  est  possible  de  calculer  les  estimations-6chantillon  en  appliquant  ladite  formule  aux 
donn6es-6chantillon  pour  chaque  estimation  requise.  Toutefois,  dans  le  cas  d'une  enquete 
ou  d'un  recensement  portant  sur  une  gamme  6tendue  de  caracteristiques,  ou  lorsque  la 
formule  d'estimation  est  assez  complexe,  il  n'est  pas  possible  d'appliquer  une  formule 
s6par6ment  pour  chaque  estimation  desire.  Dans  le  cas  du  recensement,  par  exemple, 
chaque  cellule  de  chaque  totalisation,  fond6e  sur  des  donn6es-§chantillon  recueillies  k 
chaque  niveau  g6ographique,  repr6sente  une  estimation-6chantillon  qui  n6cessite  une 
application  distincte  de  la  formule  d'estimation.  Par  ailleurs,  le  fait  de  calculer  s6par6ment 
chaque  estimation  ne  mfenerait  pas  n6cessairement  k  la  coherence  des  diverses  estimations 
effectu6es  k  partir  d'un  meme  6chantillon. 

Par  consequent,  la  m6thode  utilis6e  pour  le  recensement  et  pour  de  nombreuses  enquetes- 
6chantillon  consiste  k  decomposer  le  processus  d'estimation  en  deux  6tapes:  (a)  le  calcul 
des  coefficients  de  pond§ration,  c'est-^-dire  la  pond§ration  elle-meme  et  (b)  la  sommation 
des  coefficients  de  pond6ration  afin  de  produire  des  chiffres  estimes  de  la  population. 

Les  seules  difficult6s  math§matiques,  s'il  y  en  a,  se  rapportent  k  I'etape  (a)  qui  n'est 
effectu6e  qu'une  fois,  tandis  que  I'etape  (b)  se  limite  k  un  simple  processus  de  sommation 
des  coefficients  de  pond6ration  au  moment  ou  une  totalisation  est  extraite.  De  plus,  comme 
le  coefficient  de  pond6ration  reli6  k  une  unit6-6chantillon  est  le  meme  quelle  que  soit  la 
totalisation  effectu§e,  la  coherence  entre  les  diverses  estimations  bas6es  sur  les  donn6es- 
^chantillon  est  assur^e. 

B.  Considerations  d'ordre  th6orique 

Selon  la  th6orie  de  r6chantillonnage,  il  est  possible  de  determiner,  k  partir  d'un  plan 
d'6chantillonnage  particulier  et  d'une  procedure  d'estimation  donn6e,  les  chances  qu'un 
certain  intervalle  contienne  la  valeur  (inconnue)  que  Ton  veut  estimer  pour  la  population 
enti^re.  Le  principal  objet  de  I'estimation  est  de  r6duire  au  maximum  r6tendue  de  ces 
intervalles  de  fagon  k  ce  que  les  hypotheses  sur  les  valeurs  inconnues  de  la  population 
soient  aussi  pr6cises  que  possible.  La  mesure  courante  de  precision  utilisee  pour  comparer 
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les  proc6dures  d'estimation  est  appel6e  I'erreur-type.  Pourvu  que  certaines  conditions 
reiativement  peu  rigoureuses  soient  respect6es,  un  intervalle  de  plus  ou  molns  deux  erreurs- 
types  par  rapport  k  la  valeur  estimee  renfermera  la  valeur  de  la  population  pour  environ  95% 
de  tous  les  ^chantillons  possibles. 

En  plus  de  minimiser  I'erreur-type,  le  deuxi6nne  objectif  du  choix  d'une  nn6thode  d'estimation 
de  l'6chantillon  du  recensement  est  d'assurer  autant  que  possible  que  les  estimations- 
6chantillon  des  caract6ristiques  de  base  soient  coherentes  avec  les  valeurs  connues  de  la 
population  correspondante.  Heureusement,  ces  deux  objectifs  sont  g6n6ralement 
compl6mentaires,  c'est-^-dire  que  I'erreur  d'6chantillonnage  est  habituellement  r6duite 
lorsqu'on  s'assure  que  certaines  donn6es  de  base  sont  compatibles  avec  les  chiffres 
correspondants  de  la  population.  Cependant,  bien  que  cela  soit  vrai  en  g6n6ral,  le  fait  de 
forcer  les  estimations-6chantillon  des  caract6ristiques  de  base  k  etre  coh6rentes  avec  les 
chiffres  correspondants  de  la  population  de  tr6s  petites  cellules  peut  avoir  de  graves 
cons6quences  sur  I'erreur  d'6chantillonnage  des  estimations  des  caract6ristiques-6chantillon 
proprement  dites. 

Lorsqu'on  n'a  aucune  information  sur  la  population  6chantillonn6e  autre  que  celles  qui  ont 
6t6  recueillies  pour  les  unites  d'6chantillonnage,  la  methode  d'estimation  se  limite  ^  pond6rer 
les  unites  d'6chantillonnage  inversement  k  leur  probability  de  s6lection,  c'est-^-dire  si  toutes 
les  unit6s  d'une  province  avaient  une  chance  sur  5  d'etre  choisies,  toutes  les  unit6s  de  cette 
province  recevraient  un  coefficient  de  pond6ration  de  5.  En  pratique,  on  a  g6n6ralement 
quelque  connaissance  de  la  population  observ§e,  par  exemple,  sa  taille  globale  et, 
6ventuellement,  subdiviser  en  fonction  d'une  variable  donn6e,  supposons,  la  province.  Ces 
donn6es  peuvent  etre  utilis6es  pour  am6liorer  la  formule  d'estimation  de  fagon  k  produire 
des  estimations  qui  se  rapprochent  davantage  de  la  valeur  inconnue  de  la  population.  Dans 
le  cas  de  I'^chantillon  du  recensement,  on  dispose  d'un  grand  nombre  de  donn6es  tr6s 
d6taill6es  sur  la  population  6chantillonn6e,  soit  les  donn6es  int6grales,  k  tous  les  niveaux 
g6ographiques.  D'une  part,  on  peut  se  servir  de  cette  information  pour  am6liorer  les 
estimations  faites  k  partir  de  I'^chantillon  du  recensement  mais  d'autre  part,  cette  multitude 
de  donn6es  peut  6galement  occasionner  des  ennuis  compte  tenu  du  fait  qu'il  est  impossible 
d'obtenir  des  estimations-6chantillon  des  caract6ristiques  de  base  qui  soient  coh6rentes  avec 
toutes  les  donn6es  sur  la  population  k  tous  les  niveaux  g6ographiques.  Les  hearts  entre  les 
estimations-6chantillon  et  les  valeurs  de  la  population  apparaissent  quand  on  produit  un 
recoupement  d'une  variable  integrate  et  d'une  variable-6chantillon.  La  totalisation  doit  etre 
fond6e  sur  les  donn6es-6chantillon;  de  ce  fait,  les  totaux  marginaux  des  variables  int6grales, 
sont  des  estimations-6chantillon,  que  Ton  peut  comparer  avec  les  chiffres  correspondants 
de  la  population  d'une  autre  totalisation  bas6e  sur  les  donn6es  integrates.  II  se  peut  qu'ils 
ne  concordent  pas  exactement. 
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C.  Elaboration  d'une  m6thode  d'estimation  pour  r6chantillon  du  recensement 

Bant  donn6  qu'il  faut  attribuer  un  coefficient  de  pond6ration  k  chaque  unit6  (personne, 
fannille  ou  manage)  dans  r6chantillon,  le  plus  simple  serait  de  choisir  le  coefficient  5,  puisqu'il 
s'agit  d'un  6chantillon  de  1  sur  5.  Une  telle  m6thode  serait  simple  et  sans  biais*.  et  si  I'on 
n'avait  aucune  autre  donn6e  que  celles  de  I'^chantillon,  cela  pourrait  §tre  la  meilleure 
m6thode.  Or,  bien  qu'on  sache  que  I'^chantillon  contlendra  presque  exactement  le 
cinquidme  de  tous  les  m6nages  {k  I'exclusion  des  manages  collectifs  et  de  ceux  qui  se 
trouvent  dans  les  secteurs  d6nombr6s  par  un  repr6sentant),  on  ne  peut  pas  dtre  certain  qu'il 
contiendra  exactement  un  cinqui§me  de  toutes  les  personnes,  ou  un  cinqui6me  de  chaque 
genre  de  m6nage,  ou  un  cinqui6me  de  toutes  les  femmes  de  25  ^  34  ans,  etc.  Par 
consequent,  une  telle  m6thode  n'assurerait  pas  la  coherence,  meme  s'il  s'agit  des  sous- 
groupes  les  plus  importants  de  la  population.  Dans  ce  dernier  cas,  les  fractions  seraient  tr6s 
proches  d'un  cinquidme,  mais  elles  pourraient  varier  de  fagon  sensible  dans  le  cas  des  petits 
sous-groupes.  Une  autre  m§thode  simple  serait  de  prendre  certains  sous-groupes 
fondamentaux,  par  exemple,  les  groupes  d'age-sexe  par  province,  puis,  pour  chacun, 
compter  le  nombre  d'6l6ments  de  la  population  appartenant  au  sous-groupe  (N)  et  le 
nombre  d'unit6s  de  I'^chantillon  appartenant  au  sous-groupe  (n),  et  d'attribuer  k  chaque 
unite  d'6chantillonnage  un  coefficient  de  pond6ration  6gal  k  N/n. 

Par  exemple,  si  I'on  recensait  5  000  hommes  de  20  k  24  ans  dans  I' lle-du-Prince-Edouard, 
et  si  1  020  de  ces  hommes  faisaient  partie  des  manages  Indus  dans  r6chantillon,  un 
coefficient  de  pond6ration  de  5  000/1  020  =  4.90  serait  attribu6  k  chaque  homme  de  20  k 
24  ans  dans  I'^chantillon  de  I' lle-du-Prince-Edouard.  De  cette  fa?on,  chaque  fois  que  le 
groupe  d'&ge  quinquennal  serait  recoup6  selon  I'Sge  et  le  sexe  avec  une  caract6ristique- 
6chantillon  de  I'  I  le-du-Prince-Edouard,  le  total  marginal  pour  le  groupe  d'Sge-sexe  d'hommes 
de  20  k  24  ans  concorderait  avec  le  total  de  la  population,  soit  5  000.  A  noter  que,  dans  ce 
cas,  un  coefficient  de  pond6ration  de  5  donnerait  une  estimation-6chantillon  de  5  100 
(1  020  X  5). 

Cette  m6thode  est  connue  sous  le  nom  "d'estimation  par  la  m6thode  du  quotient".  On  peut 
prouver  que,  dans  de  nombreux  cas,  son  utilisation  m^ne  k  une  forte  reduction  de  I'erreur- 
type.  Cette  m6thode  permet  d'assurer  la  coherence  entre  les  estimations-6chantillon,  les 
totaux  de  population  des  sous-groupes  choisis  et  des  combinaisons  de  ces  sous-groupes. 
Cependant,  elle  ne  permet  pas  d'assurer  la  coherence  pour  les  plus  petits  sous-groupes,  par 
exemple,  par  ann6e  d'kge  dans  les  comt6s,  ou  pour  d'autres  groupes  d^finis  selon  d'autres 
caract6ristiques  de  base,  par  exemple,  r6tat  matrimonial  ou  la  langue  maternelle.  On 
pourrait  envisager  d'6tendre  cette  m6thode  k  de  plus  petits  sous-groupes  qui  seraient  d6finis 
comme  les  cellules  dans  un  recoupement  de  I'ensemble  des  caract6ristiques  de  base 
pertinentes.  Un  probl6me  se  pose  alors,  car  k  mesure  que  le  sous-groupe  devient  plus 
petit,  cette  m6thode  devient  instable,  c'est-^-dire  que  les  erreurs-types  des  estimations  ainsi 
produites  augmentent.  A  la  limite,  cette  m6thode  devient  impossible  k  utiliser  lorsqu'un 
sous-groupe  particulier  ne  comprend  plus  aucune  unite-6chantillon.   Le  d6fi  consiste  done 


"Sans  biais"  veut  dire  que  la  moyenne  des  estimations  de  I'ensemble  de 
tous  les  echantillons  possibles  serait  egale  a  la  valeur  de  la 
population  reelle. 
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k  profiter  des  avantages  d'une  estimation  par  la  m^thode  du  quotient  sans  subir  {'instability 
relive  k  I'utilisation  de  petits  sous-groupes.  La  solution  adoptee  consiste  k  appliquer  cette 
m^thode  de  fagon  iterative  k  deux  ensembles  distincts  et  exhaustifs  de  sous-groupes.  Cette 
m^thode,  appel^e  "m^thode  iterative  par  le  quotient"  (MIQ)  et  utilis6e  au  recensement  de 
1986,  est  d^crite  ci-aprds. 

D.  M6thode  it6rative  par  le  quotient 

Dans  cette  m^thode,  on  d^finit  deux  ensembles  de  sous-groupes  au  lieu  d'un.  Un  des 
ensembles  sert  k  former  les  lignes  d'une  "matrice  de  pond^ration"  tandis  que  I'autre  en 
forme  les  colonnes.  Ainsi,  dans  le  calcul  des  coefficients  de  pond6ration  des  personnes,  les 
sous-groupes  Sge-sexe-6tat  matrimonial  torment  les  lignes  de  la  matrice,  tandis  que  les  sous- 
groupes  situation  des  particuliers  dans  la  famille-langue  maternelle  en  torment  les  colonnes. 

Supposant  qu'on  ait  la  matrice  appropri6e,  la  MIQ  se  pr6sente  comme  suit: 

(a)  On  fait  le  classement  recoup^  des  ^l^ments  de  la  population  dans  la  matrice  de  fagon 
k  obtenir  les  totaux  de  la  population  de  chaque  ligne  et  de  chaque  colonne. 

(b)  On  fait  le  classement  recoup^  des  6l6ments  de  I'echantillon  dans  la  mSme  matrice  pour 
obtenir  les  comptes  d'^chantillon  pour  chaque  cellule  et  les  totaux  d'6chantillon  de 
chaque  ligne  et  de  chaque  colonne. 

(c)  Si  besoin  est,  on  combine  les  lignes  et  les  colonnes  de  la  matrice  en  fonction  de 
certaines  limites  de  taille  (voir  ci-apr^s). 

(d)  On  affecte  un  coefficient  de  pond^ration  initial  de  5  ^  chaque  6l6ment  de  I'echantillon. 

(e)  Pour  chaque  colonne,  on  compare  le  total  estim6  k  I'aide  de  ce  coefficient  de 
pond^ration  initial  au  total  connu  de  la  population.  On  ^limine  tout  ^cart  en  multipliant 
les  coefficients  de  pond^ration  initiaux  par  le  rapport  du  total  connu  de  la  population  au 
total  estimS  de  la  colonne.  Les  coefficients  de  pond^ration  ainsi  obtenus  sont  appelSs 
coefficients  de  pond^ration  de  la  premiere  iteration. 

(f)  Pour  chaque  ligne,  on  compare  le  total  estim6  k  I'aide  des  coefficients  de  pond6ration 
de  la  premiere  iteration  au  total  connu  de  la  population  de  la  ligne.  On  ^limine  tout  6cart 
en  multipliant  les  coefficients  de  pond6ration  de  la  premiere  iteration  par  le  rapport  du 
total  connu  de  la  population  au  total  estim^  de  la  ligne  (la  concordance  exacte  des 
colonnes  s'en  trouve  d^truite). 

(g)  On  applique  cette  mithode  d'eiimination  des  hearts  dans  les  estimations  des 
colonnes  et  des  lignes  jusqu'^  ce  que  les  hearts  qui  restent  soient  n^gligeables  (on  dit 
alors  qu'il  y  a  eu  "convergence")  ou  jusqu'^  concurrence  de  80  iterations. 

On  cesse  I'application  de  la  methode  avec  les  lignes  de  sorte  que  les  totaux  de  celles-ci 
concordent  exactement  et  que  les  totaux  des  colonnes  concordent  presque  exactement. 
L'6l6ment  important  de  cette  methode  est  que  les  limites  de  taille  visant  k  eviter  I'instabilite 
des  estimateurs  s'appliquent  seulement  aux  totaux  des  lignes  et  des  colonnes  et  non  aux 
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cellules  partlculldres  de  la  matrice,  certalnes  d'entre  elles  pouvant  d'allleurs  etre  vides.  Pour 
obtenir  plus  de  details  sur  la  MIQ,  consulter  Brackstone  et  Rao  (1979).  La  MIQ  a  6t6 
6labor6e  k  partir  de  la  "m6thode  de  rajustement  proportionnel  It6ratif",  que  Deming  et 
Stephan  (1940)  ont  6t6  les  premiers  k  presenter. 

La  MIQ  comporte  deux  param6tres  qui  ont  une  importance  cruciale  par  rapport  k  la 
coherence  entre  les  estimations-^chantillon  des  caract^ristiques  de  base  et  les  totaux 
correspondants  de  la  population.  Le  premier  est  le  choix  de  la  region  g^ographique  ou 
region  de  pond^ration  (RP)  k  laquelle  on  applique  cette  m^thode.  Les  Stapes  (a)  k  (g) 
d6crites  pr6c6demment  sont  appliqu6es  ind6pendamment  k  I'int^rieur  de  chaque  RP.  Le 
deuxidme  est  le  choix  deis  sous-groupes  qui  servent  k  former  les  lignes  et  les  colonnes  de 
la  matrice  de  pond^ration. 

La  RP  est  cette  r6gion  g6ographique  pour  laquelle  une  concordance  presque  exacte  des 
totaux  de  personnes  et  de  manages  ainsi  que  des  sous-groupes  formant  les  lignes  et  les 
colonnes  de  la  matrice  de  pond6ration  est  assur6e.  Du  point  de  vue  de  la  coherence  dans 
le  cas  des  petites  regions,  plus  la  RP  est  petite,  plus  la  coherence  sera  grande.  Dans  ce 
cas,  le  nombre  de  details  dans  les  lignes  et  les  colonnes  sera  r6duit  k  cause  des  limites  de 
taille  minimales  de  ces  lignes  et  de  ces  colonnes.  Lors  du  recensement  de  1986,  on  a 
adopts  le  compromis  suivant: 

(a)  une  RP  ne  devrait  contenir  que  2  000  k  7  000  personnes  (compte  integral); 

(b)  les  limites  des  RP  doivent  respecter  les  limites  des  divisions  de  recensement  (DR)  et, 
dans  la  mesure  du  possible,  celles  des  subdivisions  de  recensement  (SDR),  celles  des 
secteurs  de  recensement  (SR)  ainsi  que  celles  des  circonscriptions  6lectorales  f6d6rales 
(CEP); 

(c)  Les  RP  devraient  etre  compos6es  de  SD  complets  et  devraient,  de  fagon  g6n6rale,  etre 
contigues  (c'est-^-dire  ne  presenter  aucune  "zone  morte"). 

II  y  a  deux  critdres  pour  la  selection  des  sous-groupes  d'une  matrice  de  pond6ration.  En 
premier  lieu,  la  correlation  entre  les  variables  qui  d^finissent  les  sous-groupes  et  les 
caract6ristiques-6chantillon  est  importante  pour  minimiser  I'erreur  d'6chantillonnage  des 
estimations-6chantillon  des  categories.  En  second  lieu,  la  n§cessit6  d'assurer  la  coherence 
de  certains  sous-groupes  importants  influence  le  choix  des  lignes  et  des  colonnes.  Ces 
deux  critdres  sont  souvent,  mais  pas  n§cessairement,  compl6mentaires.  La  matrice  ne  peut 
pas  §tre  tr6s  d6taill6e  k  cause  de  la  taille  limite  des  lignes  et  des  colonnes.  En  1986,  on  a 
utilise  deux  matrices  distinctes,  une  pour  les  coefficients  de  pond6ration  des  personnes  et 
des  families  et  I'autre,  pour  les  coefficients  de  pond6ration  des  manages.  Ces  deux  matrices 
sont  illustrees  k  I'annexe. 

Pour  chaque  matrice,  on  a  eu  recours  k  une  strat6gie  de  regroupement  afin  de  d6finir 
comment  les  lignes  et  les  colonnes  seraient  combin6es  dans  le  cas  des  RP  ou  une  ligne  ou 
une  colonne  pr6sentent  I'un  des  crit6res  suivants  : 

(a)  le  total  de  la  population  de  la  ligne  ou  de  la  colonne  6tait  inf6rieur  k  35; 
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(b)  le  chiffre  de  I'^chantillon  de  la  ligne  ou  de  la  colonne  6talt  6gal  k  0; 

(c)  le  rapport  du  chiffre  de  population  au  chiffre  de  I'^chantillon  pour  la  ligne  ou  la  colonne 
ne  se  situait  pas  dans  I'intervalle  de  3.0  k  19.9. 

Les  strategies  de  regroupement  ont  6t6  choisies  de  fagon  ^  pr6sen/er  les  sous-groupes 
chaque  fols  que  cela  6tait  possible.  Par  exemple,  au  besoin,  la  colonne  "logement  lou6  - 
autres"  dans  la  matrice  des  menages  a  6t6  combin6e  h  la  colonne  "logement  lou6",  et  non 
avec  une  des  colonnes  "logement  poss6d6",  afin  de  consen/er  le  sous-groupe  "logement 
lou6".  Les  regroupements  ont  6t6  faits  de  fagon  ind6pendante  dans  chaque  RP  jusqu'^  ce 
que  toutes  les  contraintes  relatives  ^  la  population  des  lignes  et  des  colonnes  ainsi  qu'aux 
rapports  aient  6t6  respect6es.  Dans  les  matrices  pr6sent6es  dans  I'annexe,  des  lignes 
simples  et  doubles  s6parent  les  lignes  et  les  colonnes  en  groupes.  On  a  d'abord  fait  le 
regroupement  dans  les  groupes  s6par6s  par  des  lignes  simples,  lorsqu'elles  existaient.  Puis, 
au  besoin,  on  a  fait  les  regroupements  en  franchissant  les  lignes  simples,  mais  ^  I'lnt^rieur 
des  lignes  doubles.  On  n'a  fait  que  trds  rarement  des  regroupements  en  franchissant  les 
lignes  doubles.  Cela  ne  s'est  produit  que  lorsque  toutes  les  lignes  ou  les  colonnes  situ6es 
entre  deux  lignes  doubles  avaient  6t6  regroup6es  en  une  ligne  ou  une  colonne  dont  le  chiffre 
de  l'6chantillon  6tait  toujours  zero  mais  dont  le  chiffre  de  population  6tait  sup6rieur  ^  z6ro. 

La  MIQ  a  produit  des  coefficients  de  pond6ration  finals  qui  6taient  les  memes  pour  toutes 
les  unit6s  d'une  meme  cellule  de  la  matrice  combin6e,  mais  qui  variaient  d'une  cellule  k 
I'autre.  Ces  coefficients  finals  ont  alors  6t6  ajout6s  ^  I'enregistrement  de  chaque  unit6- 
6chantillon  dans  la  base  de  donn6es.  A  chaque  personne  dans  I'^chantillon,  on  a  attribu6 
le  coefficient  de  pond6ration  calculi  pour  la  cellule  de  la  matrice  des  personnes  et  des 
families  h  laquelle  elle  appartenait;  k  chaque  manage  dans  I'^chantillon,  on  a  attribu6  le 
coefficient  de  pond6ration  associ6  6  la  cellule  appropri6e  de  la  matrice  des  manages;  ^ 
chaque  famille  de  recensement  dans  I'^chantillon,  on  a  associ6  le  coefficient  de  pond6ration 
particulier  de  I'^poux  ou  du  parent  seul  de  la  famille.  Le  coefficient  de  pond6ration  associ6 
k  r6poux  de  la  personne  rep6re  de  la  famille  6conomique  ou,  si  r6poux  n'6tait  pas  present, 
le  coefficient  de  pond6ration  attribu6  k  la  personne  rep^re  de  la  famille  6conomique  a  6t6 
attribu6  k  la  famille  6conomique.  Un  coefficient  de  pond6ration  6gal  ^  un  a  6t6 
automatiquement  attribu6  k  toutes  les  personnes,  toutes  les  families,  et  tous  les  m6nages 
appartenant  k  des  secteurs  non  ^chantillonn^s. 

En  pratique,  I'application  de  la  MIQ  s'est  faite  presque  enti6rement  par  ordinateur.  Les  RP 
ont  6t6  form6es  en  utilisant  un  programme  qui  tenait  compte  de  la  population  du  SD,  des 
coordonn6es  g6ographiques  des  centroides  des  SD  et  des  secteurs  g6ostatistiques  (DR, 
SDR,  etc.)  auxquels  les  SD  appartiennent.  Ce  programme  a  produit  une  liste  6num6rant  les 
RP  cr66es  et  permettait  des  modifications  manuelles  si  n6cessaire.  On  n'a  fait  des 
modifications  manuelles  que  dans  un  nombre  restreint  de  cas.  Une  fois  les  RP  cr66es,  on 
a  utilis6  des  m6thodes  automatis6es  pour  le  recoupement  des  donn6es,  le  regroupement 
des  lignes  et  des  colonnes,  le  calcul  des  coefficients  de  pond6ration  et  I'attribution  de  ces 
coefficients  aux  enregistrements  de  la  base  de  donnSes. 
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IV.   PROGRAMME  D'EVALUATION  DE  L'ECHANTILLONNAGE  ET  DE  LA  PONDERATION 

Le  programme  d'6valuation  de  r6chantillonnage  et  de  la  pond6ration  avait  pour  objet  de 
determiner  I'effet  de  r6chantillonnage  et  de  la  pond6ration  sur  la  quallt6  des  donn6es-6chantlllon 
du  recensement.  A  cette  fin,  cinq  6tudes  ont  6t6  r6alis6es  afin  de  mesurer  la  quality  des 
donn6es-6chantillon  et  des  estimations-6chantillon  du  recensement  ainsi  que  de  fournir  des 
renseignements  utiles  k  la  planification  des  futurs  recensements.  Les  Etudes  ont  port^  sur  les 
sujets  suivants  : 

(a)  examen  du  biais  d'^chantillonnage; 

(b)  Evaluation  de  la  formation  des  regions  de  pondEration; 

(c)  Evaluation  des  mEthodes  de  pondEration; 

(d)  examen  de  la  coherence  des  estimations-Echantillon  et  des  chiffres  de  population; 

(e)  Etude  visant  k  produire  les  estimations  de  la  variance  pour  diverses  caractEristiques- 
Echantillon. 

La  suite  du  prEsent  chapitre  dEcrit  brievement  chacune  de  ces  Etudes.  Les  chapitres  V  ^  VIII 
en  prEsentent  les  rEsultats. 

A.  Examen  du  biais  d'Echantiilonnaqe 

Dans  toute  enquete,  un  biais  entachant  les  rEponses  peut  provenir  de  diverses  sources.  Le 
but  de  cette  Etude  Etait  de  dEterminer  si  les  rEponses  aux  questions  de  base  du 
questionnaire  2B  Etaient  biaisEes  de  quelque  fagon  que  ce  soit  et  de  cerner,  si  possible,  les 
causes  de  tout  biais  observE. 

B.  Evaluation  de  la  formation  des  rEalons  de  pondEration 

Cette  Etude  visait  ^  mesurer  le  degrE  auquel  les  RP  satisfaisaient  aux  critEres  de  formation 
Etablis  (voir  le  chapitre  III,  section  D).  Toutes  les  RP  au  Canada  ont  fait  I'objet  d'une  analyse 
en  vue  de  dEterminer  dans  quelle  mesure  elles  respectaient  les  contraintes  de  taille  et  les 
limites  des  diverses  catEgories  de  rEgions  gEographiques.  On  a  examinE  les  raisons  pour 
lesquelles  des  contraintes  de  taille  n'Etaient  pas  respectEes. 

C.  Evaluation  des  mEthodes  de  pondEration 

Le  but  de  cette  Etude  Etait  d'Evaluer  I'efficacitE  de  la  MIQ.  A  cette  fin,  on  a  examinE  le  niveau 
de  concordance  entre  les  estimations-Echantillon  et  les  chiffres  de  population  pour  les  lignes 
et  les  colonnes  des  matrices  de  recoupement  de  toutes  les  RP  au  Canada.  Le  nombre  de 
regroupements  de  lignes  et  de  colonnes,  le  degrE  de  convergence  de  la  MIQ,  et  la  variabilitE 
des  taux  d'Echantillonnage  et  les  failles  de  population  parmi  les  lignes  et  les  colonnes  ont 
aussi  EtE  examinEs  afin  d'expliquer  les  incohErences  obsen/Ees. 
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D.  Examen  de  la  coherence  des  estimations-6chantillon  et  des  chiffres  de  population 

Dans  cette  6tude,  on  a  examine  le  niveau  de  concordance,  ou  la  coherence,  entre  les 
estimations-^chantillon  et  les  chiffres  de  population  pour  un  large  6ventail  de  caract^ristiques 
de  base,  et  non  seulement  pour  celies  utilis^es  pour  d^finir  les  lignes  et  les  colonnes  des 
matrices  de  recoupement.  On  a  6tudi^  la  concordance  pour  diverses  categories  de  regions 
g^ographiques  autres  que  les  RP,  dont  les  linnites  ne  respectaient  pas  toujours  celies  des 
RP.  De  plus,  on  a  examine  ia  coherence  des  cellules  individuelles  des  matrices  de 
recoupement.  Une  6tude  distincte  a  6X6  effectu^e  en  vue  d'^valuer  la  coherence  dans  le  cas 
de  la  caract^ristique  "langue  maternelle". 

E.  Etude  de  la  variance  d'6chantll[onnaqe 

La  variance  d'une  estimation  est  une  sorte  de  mesure  de  sa  precision.  II  est  relativement 
peu  couteux  de  calculer  des  estimations  de  la  variance  pour  des  estimations  lorsqu'on  utilise 
des  coefficients  de  pond^ration  6gaux  ^  5  et  que  Ton  suppose  un  ^chantillonnage  al^atoire 
simple.  Toutefois,  il  est  beaucoup  plus  on^reux  d'estimer  la  variance,  dans  le  cas 
d'estimations  Stabiles  par  la  MIQ,  en  prenant  en  consideration  le  plan  d'ecfiantillonnage 
utilise.  Le  but  de  cette  etude  etait  d'eiaborer  une  methode  peu  couteuse  de  production  de 
telles  estimations  de  la  variance.  Pour  ce  faire,  on  a  calcuie  des  "facteurs  d'ajustement".  Un 
facteur  d'ajustement  est  le  rapport  entre  I'estimation  de  I'erreur-type  (la  racine  carre  de  la 
variance)  associee  k  la  MIQ  et  I'estimation  de  I'erreur-type  simple.  Une  estimation  de  I'erreur 
type  associee  k  la  MIQ  pour  n'importe  quelle  caracteristique  dans  toute  region  geographique 
peut  alors  etre  obtenue  en  multipliant  I'estimation  de  I'erreur-type  simple  par  le  facteur 
d'ajustement  approprie. 
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V.   BIAIS  D'ECHANTILLONNAGE 

Les  estimations  6tablies  ^  partir  d'une  enquete-6chantillon  sont  sujettes  k  des  erreurs 
d'dchantillonnage.  Un  type  d'erreur  d'6chantlllonnage  est  caus6  par  la  varlabilit6  des 
caract6ristiques  de  la  population.  Cette  variability  signifie  que  des  6cliantillons  diff6rents 
produiront  des  estimations  diff6rentes,  aucune  d'elles  n'6galant  n6cessairement  la  vraie  valeur 
de  ia  population.  Toutefois,  les  estimations  6galeront  la  vraie  valeur  de  la  population  en 
moyenne  pourvu  que  l'6chantillon  ne  comporte  pas  de  biais  donnant  lieu  k  une  tendance  k  la 
surestimation  ou  ^  la  sous-estimation.  Malheureusement,  il  est  souvent  difficile  d'6liminer  le  biais 
compldtement.  Dans  le  cas  du  recensement  de  la  population,  les  reponses  peuvent  etre 
entach6es  d'un  biais  caus6,  entre  autres,  par  les  erreurs  de  couverture,  les  erreurs  dues  k  la 
non-r6ponse,  la  d6viation  des  reponses  (par  ex.,  des  recens6s  qui  r6pondent  diff6remment  sur 
la  formule  2B  que  sur  la  formule  2A),  les  erreurs  commises  par  les  recenseurs  (par  ex.,  des 
recenseurs  ne  choisissant  pas  I'^chantillon  selon  les  exigences  6tablies),  les  erreurs  de 
traitement,  et  ainsi  de  suite. 

L'examen  du  biais  d'§chantillonnage  a  6t6  effectu6  pour  determiner  si  les  r6ponses  aux 
questions  de  base  de  la  formule  2B  comportaient  un  deviation.  Les  estimations-6chantillon  d'un 
grand  nombre  de  caract6ristiques  de  base  ont  6t6  compar6es  aux  chiffres  de  population  pour 
les  260  divisions  de  recensement  (DR)  echantillonn6es  au  Canada.  Ces  estimations-6chantillon 
ont  6t6  obtenues  en  multipliant  les  chiffres  de  r6chantillon  au  niveau  du  SD  par  le  poids  simple 
qui  est  6gal  k  la  fraction  de  sondage  inverse  du  SD  (environ  5)  et  en  faisant  ensuite  la  somme 
au  niveau  de  la  DR^  Des  representations  graphiques  des  differences  entre  les  estimations- 
echantillon  et  les  chiffres  de  population  pour  chaque  DR  ont  et6  produites  s6parement  pour 
chaque  caract6ristique  afin  de  determiner  I'existence  d'aspects  indiquant  une  tendance  precise 
k  produire  des  estimations  trop  faibles  (biais  par  d6faut)  ou  trop  eievees  (biais  par  exces).  En 
outre,  des  tests  ont  ete  effectu6s  pour  determiner  si  les  differences  entre  les  estimations- 
echantillon  et  les  chiffres  de  population  etaient  statistiquement  significatives. 

La  nature  des  differences  qui  ressortent  des  representations  graphiques  indique  que  la  plupart 
des  caracteristiques  de  r6chantillon  presentent  effectivement  un  certain  biais.  De  plus,  la 
difference  moyenne  entre  les  estimations-echantillon  et  les  chiffres  de  population  calcuiee  sur 
I'ensemble  des  DR  a  ete  jugee  statistiquement  significative  (au  niveau  de  5%*)  pour  la  plupart 
des  caracteristiques  (c'est-^-dire  que  les  differences  ne  peuvent  pas  etre  expliquees  par  la 
variabilite  de  I'echantillonnage).  Le  tableau  1  indique  les  differences  (chiffres  absolus  et 
pourcentages)  entre  les  estimations-echantillon  et  les  chiffres  de  population  k  rechelle  nationale 
(moyenne  etablie  sur  I'ensemble  des  DR)  pour  I'ensemble  des  caracteristiques  6tudiees.  Dans 
la  plupart  des  cas,  le  biais  etait  inferieur  ^1%.  Le  tableau  montre  aussi  le  pourcentage  de  DR 
dans  lesquelles  chaque  caracteristique  6tait  sur-representee.    Un  pourcentage  inferieur  k  50 


Ces  estimations  simples  ont  ete  utilisees  au  lieu  des  estimations 
obtenues  par  la  methode  iterative  du  quotient  etant  donne  que  la  MIQ 
permet  de  reduire  le  biais  d'echantillonnage  en  forgant  les  estimations 
a  egaler  les  chiffres  de  population. 

Cela  signifie  que  la  possibilite  de  relever  de  si  grandes  differences 
en  1' absence  d'un  biais  n' etait  qu'au  plus  5%. 
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Tableau  1.  Estimations-^chantillon  (pond^ration  simple)  moins  la  population  totale  i  I'^cheile 
Rationale  (SD  6chantillonn68  seulement)  et  le  pourcentage  de  DR  ou  il  y  a 
surrepr^sentation  des  caract^ristiques 


Estimations- 

Pourcentage 

Caractdristique 

dchantiiion  moins 

de  DR  ou  11  y  a 

la  population 

totale 

surrepr6sentation 

Caract^ristiques  -  Personnes 

Hommes 

1  557 

* 

(+0.01%) 

54 

Femmes 

22  017 

* 

(+0.18%) 

73 

Population  totale 

23  574 

* 

(+0.10%) 

71 

Age,  0-5 

9  185 

* 

(+0.44%) 

69 

Age.  6-14 

17  787 

* 

(+0.57%) 

75 

Age.  15-24 

-8  385 

* 

(-0.21%) 

43 

Age.  25-34 

-1  332 

* 

(-  0.03%) 

56 

Age.  35-44 

5  661 

* 

(+0.16%) 

60 

Age.  45-54 

2844 

* 

(+0.11%) 

57 

Age.  55-64 

2  360 

(+0.10%) 

49 

Age.  65  ans  et  plus 

-4  546 

* 

(-  0.19%) 

33 

C^libataires 

-462 

* 

(-  0.00%) 

55 

Personnes  marines 

37  195 

* 

(+0.32%) 

83 

Veufs  et  veuves 

-5  405 

* 

(-  0.49%) 

29 

Personnes  divorcees 

-3  937 

* 

(-  0.59%) 

41 

Personnes  s6par6es 

-3  817 

* 

(-  0.77%) 

39 

Caract6ristiques  -  Families  de  recensement 

Nombre  total  de  families 

20  056 

* 

(+0.30%) 

85 

Families  6poux-^pouse 

20  250 

* 

(+0.35%) 

85 

Families  monoparentales 

-194 

(-  0.02%) 

45 

Enfants  dans  les  families 

30  418 

* 

(+0.36%) 

76 

Personnes  dans  les  families 

70  724 

* 

(+0.34%) 

84 

Personnes  hors  famille 

-47  150 

* 

(-  1.35%) 

9 

Caract6ristiques  -  Manages  et  logements 

Propri6taires  de  logements 

5  995 

* 

(+0.11%) 

60 

Logements  lou6s 

-5  995 

* 

(-  0.18%) 

40 

Maisons  individuelles 

6  792 

* 

(+0.13%) 

68 

App.  dans  un  immeuble  <  que  5  6tages 

-5  315 

* 

(-0.31%) 

31 

App.  dans  un  immeuble  >  que  5  6tages 

-209 

(-  0.03%) 

43 

Logements  mobiles 

0 

(+0.08%) 

51 

Autres  logements 

-1  358 

* 

(-  0.12%) 

42 

Manages  d'une  personne 

-13  248 

* 

(-  0.70%) 

22 

Manages  de  2  personnes 

4  082 

(+0.15%) 

49 

Manages  de  3  personnes 

2  413 

* 

(+0.15%) 

57 

Manages  de  4  ou  5  personnes 

8  459 

* 

(+0.36%) 

72 

Manages  de  6  personnes  et  plus 

-1  706 

(-  0.52%) 

47 

Manages  non  familiaux 

-  21  249 

* 

(-  0.92%) 

14 

Manages  unifamiliaux 

22  349 

* 

(+0.35%) 

87 

Manages  multifamiliaux 

-1  100 

* 

(-1.17%) 

39 

Soutiens  du  manage  <  25  ans 

-3  739 

* 

(-0.71%) 

40 

Soutiens  du  manage  25-34  ans 

1  673 

* 

(+0.08%) 

59 

Soutiens  du  manage  35-44  ans 

3  385 

* 

(+0.17%) 

59 

Soutiens  du  manage  45-64  ans 

2  302 

(+0.09%) 

57 

Soutiens  du  manage  >  64  ans 

-3  621 

* 

(-  0.23%) 

30 

Soutiens  du  manage  sexe  masculin 

1  025 

(+0.02%) 

52 

Soutiens  du  manage  sexe  f6minin 

-1  025 

(-  0.04%) 

48 

*     Ces  differences  sont  statistiquement  significatives  au  niveau  5%. 
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signifie  que  la  caract^ristique  a  6t^  sous-repr^sent^e  dans  la  majority  des  DR.  Les  conclusions 
faites  k  partlr  de  I'analyse  des  differences  sont  donn^es  dans  les  paragraphes  qui  sulvent. 

La  taille  des  manages  de  r^chantlllon  2B  6talt  plus  importante  en  moyenne  que  celle  qui  a  6\6 
Stabile  ^  partir  des  donn^es  sur  I'ensemble  de  la  population.  Les  groupes  suivants  avalent 
d6flnltivement  tendance  k  dtre  sur-repr6sent6s  dans  I'^chantillon:  les  femmes,  les  groupes 
d'§ges  0-5  ans,  6-14  ans,  35-44  ans,  et  45-54  ans,  ainsi  que  les  membres  des  families  de 
recensement,  particuli6rement  les  personnes  marines  et  les  enfants  des  families  de 
recensement. 

Les  groupes  de  personnes  ci-apr6s  6taient  sous-repr6sent6s  dans  I'^chantillon:  les  personnes 
de  15  ^  24  ans  et  de  plus  de  64  ans,  les  veufs (veuves),  les  personnes  s6par6es,  et  les 
personnes  divorcees,  et  les  personnes  hors  famille  de  recensement.  La  sous-repr6sentation  des 
personnes  pr6sentant  ces  caract6ristiques  est  particuli^rement  significative  compte  tenu  du  fait 
qu'en  moyenne,  il  y  avait  plus  de  gens  dans  les  logements  6chantillonn6s  que  dans  les 
logements  non  6chantillonn6s. 

En  ce  qui  a  trait  aux  caract6ristiques  des  manages,  les  logements  poss6d6s  et  les  logements 
individuels  non  attenants  avalent  tendance  k  etre  sur-represent6s  dans  r6chantillon  tandis  que 
I'inverse  se  produisait  dans  le  cas  des  logements  lou6s  et  des  appartements  situ6s  dans  des 
immeubles  d'appartements  de  moins  de  5  Stages.  Les  m6nages  avec  une  famille  de 
recensement  tendaient  k  etre  sur-repr6sent6es  tandis  que  les  manages  hors  famille  de 
recensement  et,  dans  une  moindre  mesure,  les  manages  form6s  de  plusieurs  families  de 
recensement  6taient  sous-repr6sentes.  De  meme,  on  a  constats  une  sur-repr6sentation  des 
manages  de  quatre  ou  cinq  personnes  et  une  sous-repr6sentation  de  ceux  d'une  personne.  Les 
soutiens  de  m6nage  de  25-34  ans  et  de  35-44  ans  6taient  sur-repr6sent6s  tandis  que  ceux  de 
moins  de  25  ans  et  de  plus  de  64  ans  6taient  sous-repr6sent6s. 

Comme  il  a  6t6  mentionn6  pr6c6demment,  les  differences  observ6es  entre  les 
estimations-6chantillon  (bas6es  sur  une  pond6ration  simple)  et  les  chiffres  de  population  peuvent 
etre  expliqu6es  de  diverses  fagons.  II  est  possible  qu'elles  soient  attribuables  au  fait  qu'il  y  a 
eu  67  884  manages  n'ayant  fourni  aucune  r6ponse  (0.8%  de  I'ensemble)  lors  du  recensement 
de  1986.  II  s'agissait  soit  de  manages  ayant  completement  refus6  de  r6pondre  aux  questions 
ou  pour  lesquels  le  recenseur  avait  6t6  incapable  d'obtenir  des  renseignements  (habituellement 
parce  que  les  membres  du  manage  etaient  absents  au  moment  ou  le  recensement  a  6t6  men6 
ou  avaient  d6m6nag6,  le  jour  meme  du  recensement  ou  aprds  cette  date,  sans  r6pondre  au 
questionnaire).  Le  pourcentage  de  menages  §chantillonnes  constituant  des  cas  de  non-r6ponse 
6tait  plus  du  double  de  celui  des  manages  non  6chantiI!onn6s.  II  est  possible  que  les  manages 
non  r6pondants  aient  pr6sent6  de  fa?on  g6n6rale  des  caract6ristiques  diff6rentes  de  celles  des 
manages  r6pondants  (par  ex.,  manages  de  plus  petite  taille).  Le  cas  6ch6ant,  ces  diff6rences 
auraient  pu  influer  sur  les  donn6es-6chantillon  de  fagon  disproportionn6e.  Un  biais  attribuable 
k  la  non-r6ponse  aurait  6t6  introduit  aussi  bien  dans  les  donn6es-6chantillon  que  dans  les 
donn6es  integrates,  et  le  fait  que  le  biais  aurait  6t6  plus  important  pour  les  manages  de 
r^chantillon  aurait  entraTn6  des  divergences  entre  les  estimations-6chantillon  et  les  chiffres  de 
population. 

Durant  le  traitement  des  donn6es,  les  manages  6chantillonn6s  non  r6pondants  (pour  qui  aucune 
question  a  6t6  r6pondue)  ont  6t6  supprim^s  de  I'^chantillon  (de  sorte  que  ces  m6nages  sont 
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devenus  des  manages  non  6chantillonn^s)  et  seules  les  r^ponses  aux  questions  de  base  ont 
6X6  imputSes.  Par  consequent,  si  dans  le  cadre  du  processus  d'imputation  certains  types  de 
manages  avaient  tendance  k  se  faire  attrlbuer  des  r^ponses  plus  souvent  que  d'autres,  cela 
aurait  aussi  donn^  lieu  k  des  hearts  entre  les  estimations-^chantillon  et  les  chiffres  de  population 
6tant  donn^  que  seuls  les  manages  non  6chantillonn6s  auraient  6\6  touches.  Les  donn^es 
int^grales  auraient  alors  6t6  fauss^es,  mais  non  les  donn^es-Schantillon.  Lorsque  les  manages 
non  r^pondants  ont  ^t^  supprim^s  de  I'^tude,  on  a  constats  une  certaine  reduction  du  biais 
observe  pour  la  plupart  des  caract^ristiques.  Toutefois,  le  biais  restant  etait  quand  meme 
statistiquement  significatif  au  niveau  de  5%  pour  33  des  44  caract^ristiques  observ^es  (le  biais 
etait  significatif  pour  35  des  caracteristiques  avant  I'exclusion  des  manages  non  r^pondants). 
Par  consequent,  I'incidence  de  I'imputation  faite  pour  les  manages  n'ayant  fourni  aucune 
reponse  n'a  pas  ete  assez  importante  pour  expliquer  tout  le  biais  observe. 

Nous  avons  egalement  examine  les  effets  de  la  non-reponse  partielle  et,  dans  les  cas  de  non- 
reponse  totale  aux  questions-echantillon,  de  la  conversion  des  enregistrements  2B  en 
enregistrements  2A.  On  consid^re  qu'il  y  a  non-reponse  partielle  quand  un  recense  refuse  de 
repondre  k  certaines  questions,  pas  k  toutes.  Dans  des  cas  semblables,  les  reponses  ont  ete 
imputees  par  le  systeme.  Un  taux  de  non-reponse  plus  eieve  sur  les  formules  2B  que  sur  les 
formules  2A,  ou  vice  versa,  va  entraTner  des  ecarts  entre  les  estimations-echantillon  et  les  chiffres 
de  population  si  certains  types  de  menages  ou  des  personnes  ont  eu  davantage  tendance  que 
d'autres  k  refuser  de  repondre  k  certaines  questions  ou  si  le  systeme  d'imputation  a  attribue 
certaines  reponses  plus  souvent  ou  moins  souvent  qu'il  se  devait.  La  conversion  des 
enregistrements  2B  en  enregistrements  2A  va  creer  des  ecarts  entre  les  estimations-echantillon 
et  les  chiffres  de  population  si  certains  types  de  menages  ont  ete  plus  portes  que  d'autres  k  ne 
pas  repondre  aux  questions-echantillon. 

En  eiiminant  des  donnees  les  effets  de  ces  deux  facteurs,  le  biais  observe  a  ete  reduit  encore 
davantage  en  ce  qui  concerne  la  plupart  des  caracteristiques  (cette  reduction  s'ajoute  k  celle 
obtenue  par  reiimination  de  rechantillon  des  menages  ou  il  y  a  eu  non-reponse  totale). 
Toutefois,  le  biais  restant  est  demeure  statistiquement  significatif  pour  32  des  44  caracteristiques 
etudiees.  Par  consequent,  bien  que  ces  facteurs  semblent  avoir  contribue  au  biais,  une  bonne 
partie  de  ce  dernier  n'a  pu  etre  explique. 

II  est  aussi  possible  qu'une  autre  source  de  biais  provienne  du  fait  que  les  personnes  vivant 
dans  les  menages  echantillonnees  ont  ete  sous-denombrees  plus  souvent  que  ceux  des 
menages  non  echantillonnes.  On  salt  que  les  caracteristiques  des  personnes  oubliees  different 
de  celles  des  personnes  denombrees.  Un  biais  serait  introduit  dans  les  donnees  integrales  aussi 
bien  que  dans  les  donnees-echantillon,  mais  comme  le  taux  de  sous-denombrement  des 
personnes  dans  les  menages  echantillonnes  est  plus  eieve,  des  divergences  entre  les 
estimations-echantillon  et  les  chiffres  de  population  seraient  creees.  Pour  de  plus  amples 
renseignements  sur  la  couverture  dans  le  recensement  de  1986,  voir  le  Guide  k  I' intention  des 
utilisateurs  sur  la  qualite  des  donnees  du  Recensement  de  1986:  Couverture. 

Pour  de  plus  amples  renseignements  sur  I'examen  du  biais  d'echantillonnage,  voir  Rathwell 
(1990). 
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VI.   EVALUATION  DES  METHODES  DE  PONDERATION 
A.  Formation  de  regions  de  Dond6ration  (RP) 

La  premiere  6tape  des  m6thodes  de  pond6ration  a  6te  la  formation  des  RP.  Le  but  vis6  etait 
de  cr6er  des  RP  suffisamment  grandes  pour  assurer  I'application  efficace  de  la  MIQ 
(population  d'au  moins  2  000  personnes),  mais  assez  petltes  pour  respecter  les  limites  du 
plus  grand  nombre  possible  de  subdivisions  de  recensement  (SDR),  de  secteurs  de 
recensement  (SR)  et  de  circonscriptions  6lectorales  f6d6rales  (CEF).  De  plus,  les  RP 
devaient  §tre  cr66es  en  tenant  compte  des  limites  de  toutes  les  divisions  de  recensement 
(DR).  Les  SD  6cliantillonn6s  ont  6t6  form6s  en  5  341  RP^  comptant  en  moyenne  4  558 
personnes  (les  personnes  vivant  dans  des  logements  collectlfs  6tant  exclues).  Sur  les  5  341 
RP,  5  229  (98%)  avaient  une  population  se  situant  entre  3  000  et  7  000.  Des  112  RP  qui 
restaient,  107  avaient  une  population  variant  entre  2  001  et  2  999,  la  population  de  93%  de 
ces  RP  allant  de  2  501  k2  999.  Les  cinq  derni^res  RP  avaient  une  population  comprise 
entre  1  et  2  000.  Celles-cl  avaient  6t6  cr66es  sp6cialement  en  vue  de  correspondre  aux  SD 
ayant  des  fractions  de  sondage  extremes  (pr6s  de  0  ou  de  100%). 

On  a  examin6  dans  quelle  mesure  les  RP  respectaient  les  limites  de  chacun  des  diff6rents 
types  d'unit6s  g6ographiques,  notamment  les  SR,  les  SDR  dans  les  centres  divis6s  en 
secteurs  de  recensement,  les  SDR  dans  les  centres  non  divis6s  en  secteurs  de  recensement 
et  les  CEF.  Bant  donn6  que  les  limites  des  DR  ont  toujours  6t6  respect6es,  II  n'a  pas  6t6 
n6cessaire  de  faire  de  verification  k  ce  niveau.  Seule  la  partie  echantillonn6e  des  unites 
g6ographiques  a  fait  I'objet  d'un  examen  visant  a  determiner  si  les  limites  avaient  6t6 
respect6es.  Les  unites  g6ographiques  qui  ne  contenaient  pas  de  SD  6chantillonn6s  ont  6t6 
exclues  de  I'^tude. 

Le  tableau  2  montre  dans  quelle  mesure  les  RP  ont  respect6  les  limites  des  SR,  des  SDR 
et  des  CEF.  La  premiere  colonne  montre  le  pourcentage  d'unit6s  g6ographlques  ne 
contenant  que  des  RP  entidres.  La  deuxl6me  colonne  Indique  le  pourcentage  d'unit6s 
g6ographiques  qui  6taient  trop  petites  pour  former  des  RP  entldres,  mais  6taient 
compldtement  englob6es  par  une  RP.  La  trolsi6me  colonne  pr6sente  le  pourcentage 
d'unit6s  qui  comprennent  des  parties  de  RP  diff6rentes. 


Six  RP  additionnelles  ont  ete  formees  par  le  systeme  automatise,  mais 
puisqu^elles  ne  contenaient  aucun  SD  echantillonne,  elles  n'ont  pas  ete 
utilisees  par  la  MIQ. 
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Tableau  2.     Mesure  dans  laquelle  les  regions  de  pond6ration  respectent  les  diverses 
limites  gtographiques 


Unites  Contenant  Englob6es  Contenant  des 

g6ographiques  seulement  des        enti^rement  parties  de  RP 

RP  enti^res  par  une  RP  diff6rentes 

Divisions  de  recensement     100%  0%  0% 

Secteurs  de  recensement       56%  32%  12% 

Subdivisions  de 

recensement  dans  des 

centres  divis6s  en  57%  32%  11% 

secteurs  de  recensement 

Subdivisions  de 

recensement  dans  des 

centres  non  divis6s  en  8%  85%  7% 

secteurs  de  recensement 

Circonscriptions 

6lectorales  f6d6rales  15%  0%  85% 


Comme  la  MIQ  est  appliqu6e  independamment  k  I'int^rieur  des  RP,  la  concordance  entre 
les  estimations-^chantillon  et  les  chiffres  de  population  est  assur6e  seulement  dans  le  cas 
des  unites  g6ographiques  contenant  uniquement  des  RP  enti^res.  La  concordance  n'est 
pas  assur§e  pour  les  unit6s  g6ographiques  qui  sont  compl6tement  englob6es  par  une  RP 
ou  qui  contiennent  des  parties  de  RP  diff6rentes. 

Les  RP  respectalent  les  limites  des  SR  et  des  SDR  des  centres  divis6s  en  secteurs  de 
recensement  presque  aussi  bien  dans  un  cas  que  dans  I'autre.  En  ralson  de  la  petite  taille 
de  la  plupart  des  SDR  dans  les  centres  non  divis6s  en  secteurs  de  recensement,  la  majorit6 
d'entre  elles  (85%)  ont  6t6  englob^es  par  une  RP. 

Seulement  15%  des  CEF  ne  contenaient  que  des  RP  enti6res.  En  outre,  comme  les  CEF 
sont  consid6rablement  plus  grandes  que  les  RP,  aucune  d'elles  se  trouvalt  compl6tement 
comprise  dans  une  partle  d'une  RP.  La  majority  des  CEF  (80%)  contenaient  entre  5  et  30 
RP  entidres,  et  entre  1  et  10  RP  partielles.  Leurs  limites  n'ont  done  pas  6t6  bien  respect6es 
au  moment  de  la  formation  des  RP.  Bant  donn6  que  les  limites  des  CEF  n'ont  aucun 
rapport  avec  celles  des  DR,  des  SR  et  des  SDR,  elles  ne  pourraient  pas  etre  mieux 
respect6es  sans  courir  le  risque  d'enfreindre  davantage  les  limites  de  ces  derni^res. 

Pour  de  plus  amples  renseignements  sur  cette  6tude,  voir  Daoust  (1987). 
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B.  Evaluation  de  la  mdthode  iterative  du  quotient 

Un  des  buts  de  la  m^thode  de  pond^ration  consiste  ^  r^duire  les  hearts  entre  les  chiffres  de 
population  d^finis  par  les  lignes  et  les  colonnes  des  matrices  de  pond^ration  et  les 
estimations-6chantillon  correspondantes.  Ces  6carts  sont  le  r6sultat  de  la  variability  et  du 
blais  d'6chantillonnage  (voir  le  chapitre  V).  Certains  6carts  peuventtoutefois  subsister  meme 
apr^s  I'application  de  la  m^thode  de  pond^ration.  Une  des  principales  causes  de  ces  hearts 
est  le  regroupement  des  lignes  et  des  colonnes  avant  ia  pond6ration.  Cette  mesure  est  prise 
afin  de  respecter  les  contraintes  relatives  k  la  taille  qui  permettent  d'assurer  que  la  m6thode 
de  pond6ration  donne  les  r6sultats  voulus  (voir  le  chapitre  III,  section  D).  Les  hearts 
correspondent  k  la  difference  entre  les  estimations-6chantillon  et  les  chiffres  de  population, 
laquelle  est  exprim^e  en  tant  que  pourcentage  des  chiffres  de  population,  c'est-^-dire: 

estimations-6chantillon  -  chiffres  de  population 

6cart  = X  100 

chiffres  de  population 

L'6cart  peut  devenir  important  s'il  y  a  combinaison  d'une  ligne  de  faible  valeur  et  d'une  ligne 
de  valeur  importante,  ces  deux  lignes  comportant  des  fractions  de  sondage  tr6s  differentes.* 
Par  exemple,  supposons  qu'une  ligne  qui  a  une  population  de  30  et  un  ^chantillon  de  5 
(c'est-^-dire  un  taux  d'6chantillonnage  de  16.7%)  est  combin6e  k  une  ligne  qui  a  une 
population  de  90  et  un  6chantillon  de  19  (soit  un  taux  d'6chantillonnage  de  21.1%).  Le 
r6sultat  est  une  ligne  combin6e  qui  a  une  population  de  120  et  un  6chantillon  de  24.  Le 
coefficient  de  pond^ration  de  cette  ligne  pourrait  etre  d^finie  comme  6tant  120/24  =  5,  qui 
est  le  rapport  des  chiffres  de  population  k  I'estimation-echantillon  (il  s'agit,  bien  entendu, 
d'une  simplification  des  r6sultats  de  I'application  de  la  MIQ).  Selon  ce  coefficient  de 
pond6ration,  I'estimation  de  la  plus  petite  ligne  serait  5  x  5  =  25,  ce  qui  produirait  un  6cart 
de  (25  -  30) /30  X  100  =  -16.7%.  L'application  du  coefficient  de  pond6ration  k  la  ligne  ayant 
une  valeur  plus  importante  donnerait  lieu  k  une  estimation  de  19  x  5  =  95.  L'6cart 
correspondrait  k  (95  -  90) /90  x  100  =  5.6%.  II  est  done  considerable  pour  la  ligne  ayant  la 
valeur  moins  6lev6e  et  plus  faible  pour  celle  ayant  la  valeur  plus  forte. 

Les  6carts  ont  6t6  calcul6s  pour  chaque  ligne  et  chaque  colonne  de  la  matrice  des 
personnes  et  de  celle  des  manages  pour  chacune  des  principales  regions  du  pays  (I'Est,  le 
Qu6bec,  rOntario  et  I'Ouest,  y  compris  les  Territoires).  Les  hearts  relev6s  pour  toutes  les 
lignes  de  la  matrice  des  manages  6taient  inf6rieurs  ^  ±  4%  pour  toutes  les  regions  du 
Canada.  Par  exemple,  la  figure  1  (page  23)  montre  les  hearts  observes  pour  le  Canada  et 
I'Est  du  pays.  L'axe  vertical  repr6sente  l'6cart  exprime  en  pourcentage  et  6tabli  selon  la 
formule  pr6cit6e.  Les  valeurs  de  l'axe  horizontal  correspondent  k  celles  des  lignes  de  la 
matrice  des  manages,  comme  on  peut  le  voir  dans  I'annexe.  Les  lignes  verticales  montrent 
ou  se  trouvent  les  lignes  doubles  sur  la  matrice,  comme  I'indique  I'annexe;  on  regroupe 
rarement  des  colonnes  se  trouvant  d'un  c6t6  et  de  I'autre  de  ces  lignes  (voir  le  chapitre  III, 


Les  differences  entre  les  fractions  de  sondage  sont  causees  par  des 
facteurs  tels  que  la  variabilite  d'echantillonnage,  les  corrections 
faites  pour  tenir  compte  des  cas  de  non-reponse,  le  biais 
d'echantillonnage  ou  la  deviation  des  reponses. 
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section  0).  Dans  de  nombreux  cas,  les  hearts  importants  ont  6td  causes  par  la  combinaison 
de  lignes  de  faible  valeur  et  de  lignes  de  valeur  plus  importante  ayant  des  fractions  de 
sondage  tr^s  diff^rentes.  Par  exemple,  on  peut  voir  d'aprds  la  figure  1  que  la  ligne  22 
pr^sente  un  ^cart  d'environ  -  2%  pour  I'Est.  La  ligne  22  repr^sente  les  nn^nages  non 
familiaux  d'une  personne  dont  le  soutien  du  manage  est  un  homme  de  65  ans  ou  plus.  La 
figure  2  montre  le  pourcentage  de  la  population  (dans  les  SD  ^chantillonn^s  seulement) 
s'appliquant  k  chaque  ligne.  On  peut  constater  qu'il  y  a  seulement  environ  2%  des  manages 
de  la  region  de  I'Est  dans  cette  ligne.  La  figure  3  donne  le  pourcentage  de  RP  pour 
lesquelles  les  lignes  ont  6t6  combin^es.  La  ligne  22  a  6t^  combin^e  k  une  autre  ligne  dans 
presque  80%  des  cas  pour  la  region  de  I'Est.  La  plupart  du  temps,  elle  a  6t6  combin6e  k 
la  ligne  23  seulement  (manages  non  familiaux  d'une  personne  dont  le  soutien  du  manage 
est  une  femme  de  65  ans  ou  plus)  qui  avait  une  population  trois  fois  plus  importante  que 
celle  de  la  ligne  22.  En  outre,  la  figure  4  montre  que  la  fraction  de  sondage  de  la  ligne  22 
6tait  inf^rieure  k  18%  pour  I'Est  tandis  qu'elle  6tait  sup^rieure  ^  19%  ^  la  ligne  23.  II  n'est 
done  pas  surprenant  de  constater  que  la  ligne  22  pr^sente  un  6cart  de  -  2%  pour  I'Est. 

La  matrice  des  manages  comportait  beaucoup  moins  de  colonnes  que  de  lignes  (4 
comparativement  k  25).  Par  consequent,  il  n'a  fallu  effectuer  qu'un  petit  nombre  de 
regroupements.  De  plus,  les  fractions  de  sondage  ^talent  k  peu  prds  les  m§mes  pour 
chaque  colonne.  Cons^quemment,  les  colonnes  de  la  matrice  des  manages  montraient  de 
tr^s  petits  hearts  au  niveau  regional  (c'est-^-dire  ne  d^passant  pas  0.13%  pour  toutes  les 
colonnes  de  chaque  region). 

Toutes  les  lignes  de  la  matrice  des  personnes  avaient  des  hearts  de  moins  de  ±  0.1%  pour 
I'ensemble  des  regions  sauf  les  lignes  6,  7,  8,  9,  19,  20,  21  et  22.  Toutes  ces  lignes 
pr^sentaient  des  hearts  de  moins  de  ±  1%  pour  la  totality  des  regions  sauf  la  ligne  7  pour 
rOntario  ou  I'^cart  ^tait  inf^rieur  k  3%.  Ces  divergences  ont  toutes  ^t^  caus^es  par  la 
combinaison  de  lignes  de  faible  valeur  avec  des  lignes  de  valeur  considerable  ayant  des 
fractions  de  sondage  diff^rentes.  La  ligne  6  a  souvent  ete  combin^e  avec  la  ligne  7,  la  ligne 
8  avec  la  ligne  9,  la  ligne  19  avec  la  ligne  20  et  la  ligne  21  avec  la  ligne  22.  La  ligne  6  a  une 
valeur  beaucoup  plus  eiev^e  que  la  ligne  7,  la  ligne  9  a  aussi  une  valeur  consid^rablement 
sup6rieure  k  celle  de  la  ligne  8,  la  valeur  de  la  ligne  19  est  beaucoup  plus  importante  que 
celle  de  la  ligne  20  et  la  valeur  de  la  ligne  22  surpasse  nettement  celle  de  la  ligne  21. 

Les  valeurs  des  colonnes  relatives  aux  autres  langues  maternelles  de  la  matrice  des 
personnes  etaient  g^n^ralement  sous-estim^es  pour  I'Est  du  pays  (hearts  n^gatifs  de  jusqu'^ 
9%)  et,  dans  une  moindre  mesure,  pour  le  Quebec.  Les  valeurs  des  colonnes  de  la  langue 
matemelle  frangaise  tendaient  k  §tre  surestimSes  pour  I'Ouest  (hearts  positifs  de  jusqu'^  6%) 
et  dans  une  moindre  mesure  pour  I'Ontario.  On  a  aussi  constats  que  les  valeurs  relatives 
k  la  langue  maternelle  anglaise  avaient  tendance  k  etre  surestim^es  pour  le  Quebec  (hearts 
positifs  de  moins  de  2%).  Ces  r^sultats  ^talent  attribuables  au  fait  que  les  colonnes  de  la 
langue  maternelle  anglaise,  de  la  langue  maternelle  frangaise  et  des  autres  langues 
maternelles  ^talent  habituellement  toutes  combin^es  pour  I'Est  et  le  Quebec  tandis  que  les 
colonnes  relatives  k  la  langue  maternelle  frangaise  et  aux  autres  langues  maternelles  ^talent 
g^n^ralement  combin^es  pour  I'Ouest  et  I'Ontario.  La  fraction  de  sondage  relative  k  la 
langue  maternelle  frangaise  avait  tendance  k  etre  la  plus  ^lev^e,  suivie  de  la  fraction  Stabile 
pour  la  langue  maternelle  anglaise,  puis  pour  les  autres  langues  maternelles.  La  fraction  de 
sondage  peu  ^lev^e  d^termin^e  pour  les  autres  langues  maternelles  6tait  attribuable  en 
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Figure  1.    Ecarts  selon  les  lignes  de  la 
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Figure  3.  Pourcentage  des  RP  pour 

lesquelles  les  Mgnes  de  la  matrice 
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partie  aux  r6pondants  qui  avaient  tendance  k  donner  des  r6ponses  multiples  (incluses  dans 
la  cat6gorie  "Autres")  plus  souvent  sur  la  formule  2A  que  sur  la  formule  2B  (voir  le  chapitre 
VII). 

En  plus  des  regroupements,  des  hearts  entre  les  estimations-6chantillon  et  les  chiffres  de 
population  peuvent  survenir  lorsque  les  r6sultats  de  I'application  de  la  MIQ  ne  convergent 
pas.  Un  maximum  de  80  iterations  a  6t6  permis  pour  assurer  la  convergence  des  r6sultats, 
ce  qui  s'est  av6r6  suffisant  pour  toutes  les  matrices  des  manages;  en  fait,  98%  d'entre  elles 
ont  n6cessit6  moins  de  20  iterations.  Toutefois,  le  nombre  moyen  d'it6rations  pour  les 
matrices  des  personnes  §tait  beaucoup  plus  6leve.  En  fait,  il  n'y  avait  toujours  pas 
convergence  pour  385  d'entre  elles  (7.2%)  aprds  80  iterations.  Cela  touchait  uniquement  les 
colonnes  6tant  donn6  que  la  MIQ  se  termine  toujours  par  les  lignes,  de  sorte  que  les  6carts 
antra  las  lignes  combin6as  sont  toujours  nuls.  II  n'est  pas  n6cessaire  qu'il  y  ait  convergence 
exacte  pour  interrompre  I'application  de  la  MIQ  et  en  fait,  un  tel  r6sultat  est  rarement  atteint. 
Toutefois,  on  peut  s'attendre  k  ce  que  les  hearts  au  niveau  des  colonnes  soient  plus  grands 
si  la  MIQ  ne  permet  pas  d'atteindre  le  niveau  de  convergence  requis  apr6s  80  iterations.  Le 
manque  de  convergence  peut  etre  caus6  par  le  manque  de  concordance  des  contraintes 
impos6es  aux  lignes  et  aux  colonnes.  Les  contraintes  peuvent  devenir  incompatibles  dans 
les  cas  ou,  apr6s  le  regroupement  de  lignes  et  de  colonnes,  il  y  a  un  bloc  de  cellules  dans 
la  matrice  pour  lesquelles  il  n'y  a  pas  d'unit6s  6chantillonn6es,  mais  quelques  unites  dans 
la  population.  Cela  peut  creer  une  situation  ou  il  est  impossible  de  rentrer  les 
estimations-6chantillon  6gales  aux  chiffres  de  population  ^  la  fois  pour  les  lignes  et  les 
colonnes  simultan6ment.  Le  fait  d'utiliser  I'Sge  pour  definir  tant  les  lignes  que  les  colonnes 
de  la  matrice  des  personnes  a  effectivement  donn6  lieu  k  des  contraintes  incompatibles 
dans  au  moins  une  matrice,  ce  qui  a  entraTn6  une  surestimation  des  enfants  de  0  ^  14  ans 
dans  les  families  de  recensement. 

Pour  plus  de  renseignements  sur  cette  6tude,  voir  Daoust  et  Bankier  (1989). 
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VII.   EXAMEN  DE  LA  COHERENCE  ENTRE  LES  ESTIMATIONS-ECHANTILLON  ET  LES 

CHIFFRES  DE  POPULATION 

Les  contraintes  relatives  k  la  tallle  qui  sont  impos^es  aux  lignes  et  aux  colonnes  des  matrices 
de  recoupement  et  qui  sont  n^cessaires  k  une  application  efficace  de  la  MIQ,  limitent  le  nombre 
de  lignes  et  de  colonnes  que  les  matrices  pourraient  avoir.  Cons^quemment,  plusleurs 
caract6ristiques  importantes  ont  6t6  groupies  au  moment  de  la  formation  des  lignes  et  des 
colonnes.  Par  suite  de  ce  groupement,  le  niveau  de  coherence  entre  les  estimations-^chantlllon 
et  les  chiffres  de  population  pour  ces  caract6ristiques  a  et6  r^dult.  De  plus,  de  nombreuses 
regions  g^ographiques  d'int6ret  ne  se  composent  pas  toujours  de  RP  completes  (voir  le  chapltre 
V,  section  A).  Dans  ces  regions,  la  coherence  pour  I'ensemble  des  caract^ristiques  depend 
done  de  la  mesure  dans  laqueile  les  regions  se  composent  de  RP  completes. 

L'examen  de  la  coherence  porte  sur  les  divergences  entre  les  estimations-^chantillon  et  les 
chiffres  de  population  (exprlm6es  en  tant  que  pourcentages  des  chiffres  de  population)  pour  les 
memes  caract6ristiques  de  base  que  celles  de  l'examen  du  biais  d'6chantillonnage  pour  les 
regions  g6ographiques  suivantes: 

(a)  divisions  de  recensement; 

(b)  subdivisions  de  recensement; 

(c)  secteurs  de  recensement  et  secteurs  de  recensement  provinclaux; 

(d)  secteurs  de  d^nombrement. 
L'examen  de  la  coherence  a  aussi  port6  sur: 

(e)  les  cellules  des  matrices  de  pond^ration; 

(f)  la  caract6ristique  "langue  maternelle". 

Comme  il  est  lndiqu§  dans  le  chapltre  VI,  section  B,  les  hearts  entre  les  estimations-^chantillon 
et  les  chiffres  de  population  ont  ^t^  calculus  de  la  fagon  suivante: 


estimations-^chantiilon  -  chiffres  de  population 

6cart  = X  100 

chiffres  de  population 
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A.  Divisions  de  recensement  (PR) 

Les  centiles  du  tableau  3  r^sument  les  r^sultats  relatifs  au  niveau  de  coli^rence,  pour 
Tensembie  des  260  DR  6cliantillonn6es  au  Canada,  d'une  grande  variety  de  caract6rlstiques 
de  base.  Pour  chaque  caract6rlstique,  N%  des  DR  pr6sentaient  des  hearts  inf6rleurs  au  N° 
centile  tandis  que  100  -  N%  des  DR  avaient  des  divergences  sup6rleures  au  N*  centlle.  l-a 
divergence  se  situait  done  entre  le  10*  et  le  90*  centlle  pour  80%  des  DR,  entre  le  25'  et  le 
75"  centile  pour  50%  des  DR,  etc.  Par  exemple,  r6cart  pour  ie  groupe  d'§ge  0-5  ans  variait 
entre  -1 .62%  et  1 .58%  pour  80%  des  DR. 

Toutes  ies  DR  sont  form6es  uniquement  de  RP  compidtes.  AinsI,  ies  caract6ristlques 
representees  dans  la  matrice  par  une  ilgne  ou  une  colonne  qui  n'§talt  jamais  ou  presque 
jamais  combin6e  k  une  autre  pr6sentalent  une  coii6rence  presque  parfaite  au  niveau  des 
DR^  Ces  caract6ristlques  6talent  le  sexe,  ie  groupe  d'Sge  65  ans  et  plus,  toutes  les 
caract6ristiques  des  families  de  recensement,  ies  logements  poss6des,  ies  iogements  iou6s, 
les  manages  d'une  personne  et  ies  m6nages  liors  famille  de  recensement.  Le  niveau  de 
coii§rence  obsen/6  pour  les  autres  caract6rlstiques  n'6talt  pas  parfait,  mais  demeurait  quand 
meme  assez  bon,  sauf  pour  les  caract6ristiques  repr6sentant  seulement  un  faible 
pourcentage  de  ia  population  dans  la  piupart  des  DR,  par  exemple  ies  immeubles  k 
appartements  de  cinq  6tages  ou  plus  et  les  manages  formes  de  plusieurs  families  de 
recensement.  Les  representations  graphlques  (ne  figurant  pas  dans  ie  present  rapport)  des 
6carts  par  rapport  aux  ciiiffres  de  population  montrent  qu'en  g6n6rai,  plus  les  ciiiffres  de 
population  d'une  DR  sont  6iev6s,  meiiieure  est  la  coli6rence,  et  ce,  pour  toutes  ies 
caract6ristiques. 

La  derni6re  coionne  du  tableau  3  donne  ie  pourcentage  de  DR  pour  lesquelles  I'estimation 
obtenue  par  ia  iVIIQ  se  rapprociiait  davantage  des  chiiffres  de  population  que  i'estimation 
6tabiie  k  i'aide  d'un  coefficient  de  pond6ration  simple  d'environ  5^°.  L'estimation  obtenue 
par  la  IVIIQ  6tait  plus  juste  dans  la  majority  des  DR  pour  I'ensemble  des  caract6ristiques  sauf 
les  immeubles  k  appartements  de  cinq  6tages  ou  plus  et  les  manages  formes  de  plusieurs 
families  de  recensement. 
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Meme  lorsque  les  caracteristiques  presentent  une  coherence  parfaite,  les 
totalisations  des  caracteristiques  de  base  etablies  a  partir  des 
donnees-echantillon  ne  concordent  pas  parfaitement  avec  les 
totalisations  des  memes  caracteristiques  basees  sur  les  donnees 
integrales.  Cette  difference  est  attribuable  au  fait  que  les  residents 
des  logements  collectifs  qui  n' avaient  pas  a  repondre  aux 
questions -echantillon  (voir  chapitre  II,  section  B)  sont  inclus  dans  les 
totalisations  faites  a  partir  des  donnees  integrales,  mais  exclus  des 
totalisations  fondees  sur  les  donnees-echantillon. 

Le  coefficient  de  ponderation  simple  (discute  ici  et  ailleurs  egalement 
dans  ce  chapitre)  pour  chaque  unite  (personne  ou  logement)  correspondait 
en  fait  a  1' inverse  de  la  fraction  de  sondage  du  menage  pour  le  SD  dans 
lequel  1' unite  se  trouvait. 
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Tableau  3.  Centiles  des  hearts  entre  les  estimations-^chantillon  et  les  chiffres  de  population  des  DR 
(en  termes  de  pourcentages  des  chiffres  de  population),  et  pourcentage  des  DR  ou  il  y  a 
reduction  des  hearts 


Caract^ristique 


Centiles 


lOidme 


25i^me    SOidme    75i^me    90idme 


Pourcentage  des  DR 
ou  les  hearts  obte- 
nus  par  la  MIQ  6tait 
inf^rieur  ^  ceux 
obtenus  avec  une 
pond^ratlon  simple 


Caract6ristiques  -  Personnes 

Hommes 

0.00 

0.00 

0.00 

0.00 

0.00 

100 

Femmes 

0.00 

0.00 

0.00 

0.00 

0.00 

100 

Population  totale 

0.00 

0.00 

0.00 

0.00 

0.00 

100 

Age,  0-5 

-1.62 

-0.57 

0.06 

0.93 

1.58 

81 

Age,  6-14 

-1.08 

-0.62 

-0.05 

0.36 

1.02 

88 

Age,  15-24 

-0.46 

-0.20 

0.00 

0.16 

0.41 

94 

Age,  25-34 

-1.23 

-0.48 

-0.01 

0.39 

0.83 

82 

Age,  35-44 

-0.90 

-0.44 

0.03 

0.51 

1.05 

86 

Age,  45-54 

-1.00 

-0.51 

-0.03 

0.47 

0.91 

89 

Age.  55-64 

-1.06 

-0.40 

0.09 

0.52 

1.23 

88 

Age,  65  et  plus 

0.00 

0.00 

0.00 

0.00 

0.00 

100 

C^libataires 

-0.28 

-0.11 

0.01 

0.13 

0.28 

94 

Personnes  nnarl6es 

-0.33 

-0.17 

-0.07 

0.04 

0.18 

90 

Veufs  et  veuves 

-  4.49 

-2.01 

-0.07 

2.14 

5.26 

63 

Personnes  divorcees 

-8.45 

-3.64 

0.57 

4.77 

9.30 

57 

Personnes  s6par6es 

-10.60 

-4.48 

-0.22 

5.06 

10.51 

60 

Caract^ristiques  -  Families  de  recensement 

Nombre  total  de  families 

-0.13 

-0.05 

-0.01 

0.03 

0.08 

100 

Families  6poux-^pouse 

-0.13 

-0.05 

-0.01 

0.04 

0.09 

100 

Families  monoparentales 

-0.13 

-0.07 

-0.04 

0.00 

0.04 

100 

Enfants  dans  les  families 

0.08 

-0.01 

0.05 

0.10 

0.20 

100 

Personnes  dans  les  families 

-0.00 

0.00 

0.00 

0.01 

0.02 

100 

Personnes  hors  famille 

-0.12 

-0.07 

-0.03 

-0.00 

0.03 

100 

Caract^ristiques  -  lUl^nages  et  logements 

Logements  poss^^s 

-0.00 

-0.00 

0.00 

0.00 

0.00 

100 

Logements  lou6s 

-0.00 

-0.00 

0.00 

0.00 

0.00 

100 

Maisons  individuelles 

-0.53 

-0.21 

0.03 

0.22 

0.48 

74 

App.  dans  un  Immeuble  <  que  5  Stages 

-3.95 

-1.97 

-0.55 

0.37 

1.77 

77 

App.  dans  un  immeuble  >  que  5  Stages 

-  100.00 

-  34.78 

-0.77 

2.30 

16.15 

33 

Logements  mobiles 

-14.43 

-2.93 

1.30 

7.27 

16.97 

53 

Autres  logements 

-6.11 

-1.76 

0.26 

2.59 

5.27 

57 

Manages  d'une  personne 

0.00 

0.00 

0.00 

0.00 

0.00 

100 

Manages  de  2  personnes 

-1.65 

-0.80 

0.22 

0.84 

2.14 

73 

Manages  de  3  personnes 

-4.36 

-1.86 

-0.10 

1.82 

3.93 

62 

Manages  de  4  ou  5  personnes 

-2.73 

-1.11 

0.06 

1.23 

2.62 

63 

Manages  de  6  personnes  et  plus 

-11.43 

-6.19 

-1.61 

2.23 

7.10 

52 

Manages  non  familiaux 

0.00 

0.00 

0.00 

0.00 

0.00 

100 

Manages  unifamiliaux 

-0.23 

-0.05 

0.04 

0.17 

0.30 

95 

Manages  multifamiliaux 

-40.67 

-18.69 

-4.17 

6.04 

28.75 

47 

Soutiens  du  manage  <  25  ans 

-8.07 

-4.12 

-0.33 

2.45 

6.63 

64 

Soutiens  du  manage  25-34  ans 

-1.76 

-0.73 

0.12 

0.84 

1.59 

75 

Soutiens  du  manage  35-44  ans 

-1.99 

-0.81 

0.04 

0.94 

1.75 

75 

Soutiens  du  manage  45-64  ans 

-1.33 

-0.56 

0.11 

0.66 

1.27 

79 

Soutiens  du  m6nage  >  64  ans 

-  1.44 

-0.61 

-0.02 

0.38 

1.05 

87 

Soutiens  du  manage  sexe  masculin 

-0.75 

-0.38 

-0.09 

0.18 

0.41 

73 

Soutiens  du  manage  sexe  f^minin 

-1.57 

-0.56 

0.24 

1.16 

2.64 

73 
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B.  Subdivisions  de  recensement  (SDR) 

Le  tableau  4  resume  les  r^suitats  concernant  la  coherence  entre  les  estimations-^chantillon 
et  les  chlffres  de  population  pour  toutes  les  SDR  6chantillonn6es  au  Canada  dont  les  chiffres 
de  populations^  sont  sup^rieurs  ^  50.  II  porte  sur  les  memes  caract^ristiques  que  celles  du 
tableau  3.  Les  SDR  ne  sont  pas  toujours  uniquement  form6es  de  RP  entidres.  En  outre, 
elles  sont  beaucoup  plus  petites  en  moyenne  que  les  DR.  Par  consequent,  le  niveau  de 
coherence  n'est  pas  aussi  bon  pour  les  SDR  que  pour  les  DR.  Les  estimations  obtenues 
par  la  MIQ  ^talent  meilleures  que  celles  qui  avaient  6\6  Stabiles  au  moyen  de  coefficients  de 
pond6ration  simples  pour  la  majority  des  SDR  et  pour  presque  toutes  les  caract6ristiques. 
De  fa?on  g6n6rale,  comme  dans  le  cas  des  DR,  la  coherence  devenait  meilleure  k  mesure 
que  les  chiffres  de  population  des  SDR  augmentaient,  et  ce,  pour  toutes  les  caract6ristiques. 

C.  Secteurs  de  recensement  (SR)  et  secteurs  de  recensement  provinciaux  fSRP) 

Le  tableau  5  r6sume  les  r6sultats  relatifs  au  niveau  de  coherence  pour  tous  les  SR 
6chantillonn6s  au  Canada  dont  les  chiffres  de  population  sont  sup6rieurs  k  50,  et  le  tableau 
6,  pour  tous  les  SRP  6chantillonn6s  au  Canada  dont  les  chiffres  de  population  sont  aussi 
sup§rieurs  ei  50.  Les  SR  et  les  SRP  sont  en  moyenne  plus  populeux  que  les  SDR.  Les  SRP 
sont  I6g6rement  plus  populeux  en  moyenne  que  les  SR,  mais  les  limites  des  SR  ont  6t6 
mieux  respect6es  que  celles  des  SRP  au  moment  de  la  formation  des  RP.  Cons6quemment, 
la  coherence  6tait  sup§rieure  au  niveau  des  SR  qu'au  niveau  des  SRP  pour  la  plupart  des 
caract6ristiques  tandis  qu'elle  6tait  meilleure  au  niveau  des  SRP  qu'au  niveau  des  SDR  pour 
la  majority  des  caract6ristiques.  Les  caract6ristiques  faisant  exception  k  cette  r6gle  6taient 
g6n6ralement  celles  qui  pr§sentaient  une  coherence  mediocre  k  tous  les  niveaux 
g^ographiques.  La  coherence  des  estimations  obtenues  par  la  MIQ  6tait  sup^rieure  k  celle 
des  estimations  faites  k  partir  de  coefficients  de  pond6ration  simples  pour  la  majority  des 
SR  et  des  SRP,  et  ce,  pour  presque  toutes  les  caract6ristiques. 

D.  Secteurs  de  d6nombrement  (SD) 

Les  SD  sont  les  composantes  des  RP.  Tous  les  SD  sauf  cinq  qui  ont  fait  I'objet  d'un 
traitement  special  (voir  le  chapitre  VI,  section  A)  ne  constituaient  qu'une  partie  d'une  RP,  ce 
qui  repr6sente  le  plus  bas  niveau  auquel  les  estimations-6chantillon  sont  forcees  de 
concorder  avec  les  chiffres  de  population.  De  plus,  les  coefficients  de  pond6ration  initiaux 
utilises  6taient  les  memes  pour  toutes  les  personnes  et  tous  les  manages  de  la  meme  RP, 
mdme  si  la  fraction  de  sondage  diff6rait  entre  les  SD  de  la  RP,  tandis  que  les  coefficients  de 
pond6ration  simples  ont  6t6  calcul6s  au  niveau  des  SD.  Par  cons6quent,  on  ne  peut  pas 
s'attendre  k  ce  que  la  coherence  au  niveau  des  SD  soit  aussi  bonne  qu'^  des  niveaux  plus 
6lev6s.  En  fait,  le  tableau  7  montre  que  la  coherence  des  estimations  6tablies  par  la  MIQ 
6tait  sup6rieure  k  celle  des  estimations  faites  k  I'aide  de  coefficients  de  pond6ration  simples 


^^  On  parle  ici  du  chiffre  de  la  population  de  la  caracteristique  a 
1' etude.  Par  exemple,  le  niveau  de  coherence  du  groupe  d'age  0-5  ans 
est  defini  a  partir  de  tous  les  SDR  dans  lesquelles  il  y  avait  plus  de 
50  personnes  dans  le  groupe  d'age  0-5  ans.  La  meme  definition 
s' applique  aux  tableaux  5,  6,  et  7. 
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Tableau  4.  Gentiles  des  6carts  entre  les  estimations-^chantillon  et  lea  chiffres  de  population  des 
SDR  (en  termes  de  pourcentages  des  chiffres  de  population),  et  pourcentage  des  SDR 
ou  il  y  a  reduction  des  hearts 


Caract6ristique 


Gentiles 


lOidme        25i^me    SOidme    75idme    90idme 


Pourcentage  des  SDR 
oij  les  hearts  obte- 
nus  par  la  MIQ  §tait 
infSrieur  k  ceux 
obtenus  avec  une 
pond^ration  simple 


Caract^ristiques  -  Personnes 

Hommes 
Femmes 
Population  totale 
Age,  0-5 
Age,  6-14 
Age,  15-24 
Age.  25-34 
Age,  35-44 
Age,  45-54 
Age,  55-64 
Age,  65  et  plus 
Cilibataires 
Personnes  marines 
Veufs  et  veuves 
Personnes  divorcees 
Personnes  s^par^es 


-9.15 
-9.38 
-7.56 

-  20.36 

-  20.42 

-  20.30 

-  17.54 
-17.96 

-  19.38 

-  20.51 

-  19.39 
-13.63 

-8.50 

-  18.22 
-21.57 

-  22.91 


Caract^ristiques  -  Families  de  recensement 


Nombre  total  de  families 
Families  6poux-6pouse 
Families  monoparentales 
Enfants  dans  les  families 
Personnes  dans  les  families 
Personnes  liors  famille 


-7.15 
-8.19 

-  10.41 

-  14.51 
-9.44 

-  19.36 


Caract6ristiques  -  Manages  et  logements 

Logements  poss^^s  -  6.75 

Logements  lou6s  - 13.97 

Maisons  indivlduelles  -  5.94 
App.  dans  un  immeubie  <  que  5  Stages  -  8.04 
App.  dans  un  immeubie  >  que  5  §tages       -  6.44 

Logements  mobiles  - 12.25 

Autres  logements  - 13.81 

M6nages  d'une  personne  - 15.74 

M6nages  de  2  personnes  - 15.78 

M6nages  de  3  personnes  -  20.29 

M6nages  de  4  ou  5  personnes  -15.91 

Manages  de  6  personnes  et  plus  -  25.23 

Manages  non  familiaux  - 15.97 

Manages  unifamiliaux  -  7.10 

Manages  multifamiliaux  -  26.53 

Soutiens  du  m6nage  <  25  ans  - 19.76 

Soutiens  du  m6nage  25-34  ans  - 16.94 

Soutiens  du  manage  35-44  ans  - 15.77 

Soutiens  du  m6nage  45-64  ans  - 15.44 

Soutiens  du  manage  >  64  ans  - 15.74 

Soutiens  du  manage  sexe  masculin  -  7.63 

Soutiens  du  m6nage  sexe  f6minin  - 15.84 


-3.46 
-3.44 
-2.71 
-7.44 
-7.16 
-7.40 
-6.53 
-6.29 
-7.09 
-7.11 
-6.41 
-4.81 
-3.11 
-7.61 
-8.48 
■  10.45 


2.59 
2.85 
1.93 
5.02 
3.19 
6.80 


-2.51 
-3.79 
-2.36 
-3.38 
-2.37 
-5.52 
-5.24 
-4.22 
-5.99 
-8.25 
-6.47 
■12.60 
-5.15 
-2.58 
■  13.34 
-9.84 
-6.20 
-5.70 
-5.68 
-5.77 
-2.94 
-5.72 


0.00 
0.00 
0.00 
0.05 
0.16 
0.00 
0.05 
0.10 
0.11 
0.08 
0.00 
0.02 
•0.06 
0.41 
0.61 
0.30 


0.02 
0.02 
0.04 
0.05 
0.00 
0.03 


0.00 
0.00 
0.01 
0.51 
0.12 
0.80 
0.09 
0.00 
0.11 
0.02 
0.16 
2.12 
0.00 
0.07 
■3.13 
•1.42 
0.03 
0.12 
0.04 
0.02 
-0.03 
0.12 


3.26 
3.34 
2.59 
7.28 
7.14 
6.23 
6.29 
6.63 
6.47 
7.53 
7.05 
4.60 
3.07 
8.82 
10.55 
9.52 


2.78 
2.95 
0.84 
5.05 
3.24 
5.89 


2.41 

3.68 

2.23 

2.07 

1.93 

6.84 

6.08 

4.73 

6.57 

8.85 

7.29 

8.48 

5.14 

2.95 

8.55 

6.33 

5.73 

5.50 

5.78 

5.66 

2.71 

6.66 


9.75 
8.97 
7.93 
19.33 
19.61 
19.22 
17.55 
18.49 
19.73 
19.78 
19.12 
13.08 
8.71 
19.97 
20.73 
20.13 


7.48 
8.18 
9.53 

14.43 
9.53 

18.96 


6.80 

13.58 

5.98 

7.25 

6.88 

15.26 

14.79 

15.46 

16.36 

20.53 

15.98 

22.15 

16.05 

7.41 

21.56 

16.59 

15.21 

15.01 

14.76 

15.70 

7.20 

18.07 


60 
60 
58 
65 
65 
66 
62 
64 
65 
65 
67 
62 
57 
58 
54 
56 


56 
59 
82 
63 
61 
68 


54 
70 
40 
64 
36 
48 
55 
72 
57 
51 
51 
54 
69 
56 
39 
59 
61 
63 
58 
65 
48 
59 
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Tableau  5.  Gentiles  des  hearts  entre  les  estimations-^chantiiion  et  les  chiffres  de  population  des  SR 
(en  termes  de  pourcentages  des  chiffres  de  population),  et  pourcentage  des  SR  ou  il  y  a 
reduction  des  hearts 


Caract^ristique 


Gentiles 


lOi^me        25i6me    50i6me    75i6me    90i6me 


Pourcentage  des  SR 
ou  les  hearts  obte- 
nus  par  la  MIQ  ^tait 
inf6rieur  ^  ceux 
obtenus  avec  une 
pond^ratlon  simple 


Caract^ristiques  -  Personnes 

Hommes 

-2.13 

0.00 

0.00 

0.00 

1.93 

83 

Femmes 

-1.95 

0.00 

0.00 

0.00 

1.93 

82 

Population  totale 

-1.67 

0.00 

0.00 

0.00 

1.52 

81 

Age,  0-5 

-7.69 

-3.31 

0.01 

3.52 

8.43 

76 

Age.  6-14 

-6.95 

-2.51 

-0.02 

2.44 

6.69 

77 

Age,  15-24 

-4.85 

-1.15 

0.00 

1.00 

4.66 

83 

Age,  25-34 

-5.28 

-2.27 

-0.02 

2.12 

5.57 

73 

Age,  35-44 

-5.64 

-2.14 

-0.09 

2.04 

5.46 

74 

Age.  45-54 

-6.28 

-2.00 

-0.12 

2.01 

5.84 

77 

Age,  55-64 

-5.64 

-2.00 

0.00 

2.22 

6.46 

79 

Age,  65  et  plus 

-5.17 

0.00 

0.00 

0.00 

5.27 

85 

C^libataires 

-2.85 

-0.60 

-0.04 

0.63 

2.82 

81 

Personnes  marines 

-2.32 

-0.74 

-0.07 

0.60 

2.01 

77 

Veufs  et  veuves 

-  16.22 

-7.93 

0.31 

8.20 

17.01 

59 

Personnes  divorcees 

-21.36 

-  10.75 

0.36 

11.23 

21.66 

55 

Personnes  s6par6es 

-  24.42 

-12.65 

0.17 

11.96 

24.32 

57 

Caract6ristiques  -  Families  de  recensement 

Nombre  total  de  families 

-2.03 

-0.30 

0.00 

0.23 

1.70 

79 

Families  6poux-6pouse 

-2.22 

-0.33 

0.01 

0.25 

2.05 

81 

Families  monoparentales 

-5.68 

-0.26 

-0.01 

0.17 

6.13 

86 

Enfants  dans  les  families 

-3.28 

-0.34 

0.03 

0.52 

3.39 

84 

Personnes  dans  les  families 

-2.07 

-0.03 

0.00 

0.06 

1.88 

84 

Personnes  hors  famille 

-4.37 

-0.29 

-0.02 

0.13 

4.26 

84 

Caract^ristiques  -  Manages  et  logements 

Logements  poss^^s 

-1.81 

-0.01 

0.00 

0.01 

2.02 

82 

Logements  lou6s 

-2.87 

-0.01 

0.00 

0.01 

2.73 

81 

Maisons  Individuelles 

-2.90 

-1.14 

0.04 

1.08 

2.96 

58 

App.  dans  un  immeuble  <  5  Stages 

-7.43 

-3.19 

-0.42 

1.95 

6.14 

52 

App.  dans  un  immeuble  >  5  Stages 

-7.16 

-2.74 

0.01 

2.85 

8.24 

39 

Logements  mobiles 

-9.78 

-4.81 

0.41 

5.20 

12.27 

46 

Autres  logements 

-9.80 

-4.19 

0.40 

4.76 

11.29 

52 

Manages  d'une  personne 

-4.59 

0.00 

0.00 

0.00 

4.35 

85 

Manages  de  2  personnes 

-6.91 

-2.82 

0.30 

3.55 

7.69 

66 

Manages  de  3  personnes 

-  14.29 

-7.20 

-0.41 

6.58 

13.31 

54 

Manages  de  4  ou  5  personnes 

-11.01 

-5.34 

0.06 

5.07 

10.44 

56 

Manages  de  6  personnes  et  plus 

-31.23 

-  18.37 

-4.06 

11.43 

26.77 

51 

M6nages  non  familiaux 

-4.34 

0.00 

0.00 

0.00 

3.92 

84 

Manages  unifamiliaux 

-2.10 

-0.67 

0.08 

0.73 

2.08 

73 

Manages  multifamiliaux 

-  35.67 

-21.14 

-4.87 

10.28 

26.72 

46 

Soutiens  du  manage  <  25  ans 

-  22.02 

-11.03 

-1.15 

9.01 

20.36 

57 

Soutiens  du  manage  25-34  ans 

-7.67 

-3.45 

0.08 

3.59 

7.83 

68 

Soutiens  du  m6nage  35-44  ans 

-8.45 

-3.82 

0.02 

3.68 

8.15 

67 

Soutiens  du  manage  45-64  ans 

-6.34 

-3.01 

0.07 

3.03 

6.34 

67 

Soutiens  du  manage  >  64  ans 

-7.95 

-2.87 

-0.12 

2.85 

7.70 

74 

Soutiens  du  manage  sexe  masculin 

-2.89 

-1.06 

0.00 

1.00 

2.53 

68 

Soutiens  du  manage  sexe  f^minin 

-6.77 

-2.48 

0.00 

2.59 

7.09 

70 
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Tableau  6.  Centiles  des  hearts  entre  les  estimations-^chantillon  et  lea  chiffres  de  population  des 
SRP  (en  termes  de  pourcentages  des  chiffres  de  popuiation),  et  pourcentage  des  SRP 
ou  ii  y  a  reduction  des  hearts 


Caract^ristique 


Centiles 


lOi^me        25i^me    SOi^me    75i^me    90idme 


Pourcentage  des  SRP 
oil  les  hearts  obte- 
nus  par  la  MIQ  dtait 
inf^rieur  k  ceux 
obtenu  avec  une 
pond^ration  simple 


Caract6ristiques  -  Personnes 

Hommes 
Femmes 
Population  total 
Age,  0-5 
Age,  6-14 
Age,  15-24 
Age,  25-34 
Age,  35-44 
Age,  45-54 
Age,  55-64 
Age,  65  et  plus 
Cilibataires 
Personnes  marines 
Veufs  et  veuves 
Personnes  divorc6es 
Personnes  s^par^es 


-2.56 
-2.71 
-2.11 
-9.10 
-7.30 
-6.27 
-6.18 
-6.96 
-8.10 
-7.73 
-7.67 
-3.86 
-2.51 

-  14.31 

-  22.77 
-25.88 


Caract^ristiques  -  Families  de  recensement 

Nombre  total  de  families  -  2.06 

Families  6poux-6pouse  -  2.40 

Families  monoparentaies  - 1 1 .62 

Enfants  dans  les  families  -  4.25 

Personnes  dans  les  families  -  2.48 

Personnes  hors  famille  -  7.23 

Caract^ristiques  -  M6nages  et  logements 

Logements  poss^^s  -  2.18 

Logements  lou^s  -  6.58 

Maisons  individuelles  -  2.35 

App.  dans  un  immeuble  <  5  Stages  -.  8.73 

App.  dans  un  immeuble  >  5  Stages  - 1 1 .49 

Logements  mobiles  - 17.70 

Autres  logements  - 14.48 

Manages  d'une  personne  -  8.38 

Manages  de  2  personnes  -  7.94 

Manages  de  3  personnes  - 14.18 

Manages  de  4  ou  5  personnes  -  8.82 

Manages  de  6  personnes  et  plus  -  27.93 

Manages  non  familiaux  -  8.14 

Manages  unifamiliaux  -  2.20 

Manages  muittfamiiiaux  -  40.55 

Soutiens  du  manage  <  25  ans  -  22.45 

Soutiens  du  manage  25-34  ans  -  8.15 

Soutiens  du  m6nage  35-44  ans  -  8.76 

Soutiens  du  manage  45-64  ans  -  6.77 

Soutiens  du  manage  >  64  ans  -  8.77 

Soutiens  du  manage  sexe  mascuiin  -  2.77 

Soutiens  du  manage  sexe  f^minin  -  8.33 


-1.03 
-0.98 
-0.81 
-3.88 
-3.34 
-2.68 
-2.85 
-2.92 
-3.52 
-3.34 
-2.79 
-1.42 
-1.04 
-7.61 
■11.34 
-  14.01 


0.84 
0.92 
4.51 
1.55 
0.98 
2.61 


-0.87 
-2.32 
-1.17 
-3.96 
-5.05 
-8.38 
-6.59 
-2.97 
-3.73 
-7.20 
-4.52 
-14.93 
-2.63 
-0.93 
-  30.78 
-11.77 
-3.71 
-4.22 
-3.23 
-3.60 
-1.39 
-3.49 


0.00 
0.00 
0.00 
0.02 
0.11 
0.00 
0.06 
0.01 
0.05 
0.06 
0.00 
0.02 
•0.09 
•0.13 
1.89 
■1.05 


0.00 
0.00 
0.05 
0.07 
0.00 
0.00 


0.00 

0.00 

0.02 

0.46 

0.79 

0.59 

0.35 

0.00 

0.17 

0.00 

0.21 

•1.40 

0.00 

0.06 

-9.42 

-1.14 

0.12 

0.11 

0.19 

■0.13 

-0.04 

0.11 


1.03 
1.05 
0.76 
4.24 
3.33 
2.52 
2.76 
3.08 
3.54 
3.47 
2.75 
1.58 
0.95 
7.21 
13.72 
13.12 


0.84 
0.97 
4.20 
1.77 
0.95 
2.63 


0.76 
2.34 
1.16 
2.77 
4.40 
7.61 
6.75 
2.90 
3.72 
6.97 
4.72 
12.04 
2.92 
1.01 
14.13 
10.04 
4.15 
4.49 
3.41 
3.30 
1.16 
3.98 


2.67 
2.60 
2.06 
8.75 
7.34 
6.69 
6.29 
6.51 
8.00 
8.04 
7.08 
3.91 
2.41 
14.74 
25.20 
26.44 


2.18 
2.43 
10.81 
4.23 
2.58 
7.10 


2.07 

6.37 

2.44 

7.15 

9.71 

16.63 

15.89 

8.04 

8.00 

14.41 

9.09 

27.55 

7.05 

2.29 

29.67 

20.82 

8.50 

9.25 

6.76 

7.93 

2.54 

9.07 


70 
71 
70 
70 
71 
73 
67 
70 
70 
69 
75 
69 
70 
59 
53 
54 


70 
72 
74 
72 
74 
77 


67 

72 

51 

62 

40 

48 

55 

75 

62 

54 

56 

51 

75 

68 

59 

56 

64 

63 

63 

69 

59 

64 
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Tableau  7.  Pourcentage  de  tous  les  SD  6chantillon68  au  Canada  dont  le  chiffre  de  population  excdde 
50  et  ou  les  6cart8  obtenus  par  la  MIQ  dtaient  inf6rieurs  h  ceux  obtenus  k  partir  des 
coefficients  de  pond^ration  simples 


Pourcentage  de 

Pourcentage  de 

Caract^ristiques 

SD  oCi  il  y  a 

Caract^ristiques 

SD  ou  il  y  a 

eu  r^uction 

eu  r6duction 

des  hearts 

des  hearts 

Hommes 

7 

Logements  poss^^s 

5 

Femmes 

7 

Logements  lou^s 

4 

Age,  0-5 

19 

App.  dans  un  immeuble  <  5  6tages 

2 

Age,  6-14 

17 

App.  dans  un  immeuble  >  5  Stages 

1 

Age,  15-24 

17 

Logements  mobiles 

0 

Age.  25-34 

15 

Autres  logements 

3 

Age,  35-44 

16 

Manages  d'une  personne 

9 

Age,  45-54 

19 

M6nages  de  2  personnes 

16 

Age,  55-64 

19 

Manages  de  3  personnes 

18 

Age,  65  et  plus 

15 

Manages  de  4  ou  5  personnes 

12 

C^libataires 

10 

Manages  de  6  personnes  et  plus 

3 

Personnes  marines 

7 

Manages  non  familiaux 

9 

Veufs  et  veuves 

11 

Manages  unifamiliaux 

6 

Personnes  divorc6es 

10 

Manages  multifamiliaux 

* 

Personnes  s6par6es 

6 

Soutiens  du  manage  <  25  ans 

5 

Nonnbre  total  de  families 

6 

Soutiens  du  manage  25-34  ans 

16 

Families  ^poux-^pouse 

7 

Soutiens  du  manage  35-44  ans 

16 

Families  monoparentales 

8 

Soutiens  du  m6nage  45-64  ans 

16 

Enfants  dans  les  families 

11 

Soutiens  du  manage  >  64  ans 

11 

Personnes  dans  les  families 

7 

Soutiens  du  m6nage  sexe  masculin 

7 

Personnes  hors  famille 

14 

Soutiens  du  manage  sexe  feminin 

12 

Aucun  SD  ne  comptait  plus  de  50  m6nages  multifamiliaux. 
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pour  moins  de  20%  de  tous  les  SD  ^chantillonn^s  au  Canada  dont  les  chiffres  de  population 
exc^dent  50,  pour  toutes  les  caract^ristiques  observ6es. 

E.  Cellules  des  matrices  de  pond6ration 

La  MIQ  pernnet  seulement  de  garantir  que  les  totaux  estimatifs  des  llgnes  et  des  colonnes 
de  la  matrlce  de  recoupement  concordent  avec  les  chiffres  de  population  correspondants. 
II  n'y  a  aucun  m^canisme  de  controle  au  niveau  des  cellules  individuelles  de  la  matrice.  On 
a  6tudi§  la  coherence  au  niveau  des  cellules  pour  les  matrices  des  personnes  et  des 
manages  pour  cinq  RP  choisies  au  hasard  (seules  les  cellules  comportant  des  unites 
^chantillonn^es  ^talent  incluses).  Sur  les  dix  matrices,  la  coherence  des  estimations  par  la 
MIQ  ^tait  meilleure  que  celle  des  estimations  simples  utilisant  des  coefficients  de  pond^ration 
§gaux  k  la  fraction  de  sondage  inverse  des  manages  du  RP  pour  58%  des  cellules  et  moins 
bonne  pour  42%  d'entre  elles.  Les  cellules  pour  lesquelles  les  estimations  obtenues  par  la 
MIQ  ^talent  sup^rieures  aux  estimations  simples  avaient  en  moyenne  des  chiffres  de 
population  plus  Aleves  que  ceux  des  cellules  restantes.  De  plus,  les  hearts  avaient  tendance 
k  d^croTtre  k  mesure  que  les  chiffres  de  population  des  cellules  augmentaient. 

On  a  constats  que  I'application  de  la  MIQ  entraTnait  une  nette  surestimation  des  valeurs  des 
cellules.  Sur  les  dix  matrices,  la  valeur  des  cellules  a  §t6  surestim^e  dans  58%  des  cas  et 
sous-estim^e  dans  42%  des  cas.  Aucune  unit^  n'a  6\6  choisie  dans  I'^chantillon  pour  22% 
des  cellules  n'ayant  pas  des  chiffres  de  population  nuls.  Bant  donn§  que  les  estimations 
des  lignes  et  des  colonnes  doivent  concorder  avec  les  chiffres  de  population,  cela  signifie 
que  les  estimations  des  autres  cellules  doivent  etre  augment^es  afin  de  contrebalancer  la 
sous-estimation  de  ces  cellules.  C'est  probablement  ce  qui  explique  en  grande  partie  sinon 
entidrement  la  surestimation.  Toutefois,  6tant  donn6  que  la  taille  des  cellules  sans  unites 
6chantillonn6es  est  petite,  la  surestimation  est  ^galement  faible. 

Pour  plus  de  renseignements  sur  I'examen  de  la  coherence,  voir  Rathwell  (1990). 

F.  Coherence  de  la  caract6rlstique  "lanaue  maternelle" 

Une  ^tude  distincte  a  ^tS  faite  sur  la  coherence  des  r6ponses  k  la  question  sur  la  langue 
maternelle.  A  I'^chelle  nationale,  la  divergence  entre  les  estimations-^chantillon  et  les  chiffres 
de  population  pour  les  categories  de  r^ponse  "anglais  seulement"  et  "frangais  seulement" 
etait  infime.  Toutefois,  des  hearts  plus  importants  ont  6t6  relev^s  dans  les  cas  de  r^ponses 
multiples  (-  9.67%),  particulidrement  pour  les  categories  "anglais  et  fran^ais"  (-  7.35%)  et 
"anglais  et  langues  non  officielles"  (-  11.64%). 

Un  pourcentage  plus  ^lev^  de  personnes  ont  donn§  des  r^ponses  multiples  sur  la  formule 
2A  (3.9%  avant  I'imputation)  que  sur  la  formule  2B  (3.3%  avant  I'imputation)  de  sorte  que  la 
fraction  de  sondage  pour  cette  cat^gorie  6tait  faible.  De  plus,  les  r^ponses  multiples  ont  6te 
incluses  dans  les  colonnes  "autre  langue  maternelle"  de  la  matrice  de  pond^ration  des 
personnes  qui  ont  souvent  ^t^  combin^es  avec  les  colonnes  "anglais  seulement"  et  "frangais 
seulement".  Ces  deux  facteurs  ajout^s  au  fait  que  les  r^ponses  multiples  repr^sentaient  un 
pourcentage  relativement  faible  de  la  population  ont  donn^  lieu  k  une  Importante 
sous-estimation  du  nombre  de  personnes  ayant  plus  d'une  langue  maternelle  (voir  le  chapitre 
VI,  section  B). 
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Le  pourcentage  plus  6lev6  de  r^ponses  multiples  sur  la  formule  2A  que  sur  la  formule  2B  ne 
peut  §tre  impute  au  controle  et  k  rimputatlon  ou  au  traltement  des  donn6es  pas  plus  qu'k 
la  variability  de  I'^chantillonnage.  II  semble  que  les  r^pondants  ont  interpr^t^  la  question  sur 
la  langue  maternelle  diff^remment  sur  la  formule  2B  que  sur  la  formule  2A.  Bien  que  la 
raison  precise  de  cette  difference  d'interpr^tation  soit  inconnue,  il  est  possible  que  les 
questions  additionnelles  sur  la  langue  et  I'origine  ethnique  de  la  formule  2B  puissent  avoir 
aide  k  r^duire  le  nombre  de  personnes  ayant  indiqu^  plus  d'une  langue  maternelle  en  leur 
fournissant  une  autre  occasion  de  declarer  toute  autre  langue  parl^e  et  (ou)  origine.  De  plus, 
le  fait  que  les  instructions  se  rapportant  aux  questions,  qui  precisaient  que  les  r^ponses 
multiples  6taient  permises,  figuraient  sur  la  formule  2A  et  non  dans  un  livret  distinct,  comme 
pour  la  formule  2B,  peut  avoir  eu  une  incidence  sur  la  difference  dans  la  frequence  des 
reponses  multiples. 

Pour  plus  de  renseignements,  voir  Daoust  (1988). 
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VIII.  VARIANCE  D'ECHANTILLONNAGE 

L'erreur  d'6chantillonnage  a  deux  composantes:  la  variance  et  le  biais.  La  variance  mesure 
la  variability  de  I'estimation  des  valeurs  que  prendrait  une  variable  par  rapport  k  sa  valeur 
moyenne  obtenue  pour  des  repetitions  hypoth6tiques  du  processus  d'enqu§te.  Le  biais  est 
la  difference  entre  la  valeur  moyenne  que  prendrait  une  estimation  dans  I'hypothese  d'une 
repetition  de  la  procedure  d'enquete  et  la  valeur  reelle  de  la  variable  obsen/6e.  Le  chapitre 
V,  qui  contient  les  r6sultats  de  retude  du  biais  d'echantillonnage,  d6crit  la  nature  et 
I'importance  du  biais  dans  les  estimations-echantillon  avant  la  ponderation.  Les  chapitres 
VI  et  VII  examinent  le  biais  d'echantillonnage  apres  la  ponderation.  Meme  avec  une 
methode  d'echantillonnage  totalement  depoun/ue  de  biais,  les  resultats  seraient  sujets  k  la 
variance  du  simple  fait  que  les  estimations  ont  6te  produites  k  partir  d'un  echantillon.  La 
variance  peut  etre  estimee  k  I'aide  des  donnees  recueillies  dans  I'enquete-echantillon.'* 
uetude  de  la  variance  d'echantillonnage  a  ete  effectue  afin  d'estimer  I'effet  des  methodes 
d'echantillonnage  et  d'estimation  sur  les  chiffres  du  recensement  etablis  k  partir  de  donn6es- 
echantillon. 

Statistique  Canada  produit  des  milliers  de  tableaux  k  partir  des  donnees-echantillon  (c'est-^- 
dire  celles  recueillies  sur  la  formule  2B).  Th6oriquement,  on  pourrait  fournir  une  mesure  de 
precision  {k  savoir  I'estimation  de  la  variance  d'echantillonnage)  pour  chaque  estimation 
presentee  dans  ces  tableaux.  Cette  mesure  tiendrait  compte  k  la  fois  du  plan  de  sondage 
et  de  la  methode  d'estimation.  En  pratique  cependant,  11  est  impossible  d'etablir  de  telles 
mesures  pour  toutes  les  estimations  du  recensement  en  raison  du  cout  eieve  du  traitement 
des  donnees.  On  calcule  done  la  variance  d'echantillonnage  pour  un  sous-ensemble 
seulement  des  estimations  du  recensement.  Cela  permet  ensuite  d'6valuer  les  effets 
combines  du  plan  de  sondage  et  de  la  methode  d'estimation  sur  la  variance 
d'echantillonnage.  On  peut  ensuite  ajuster  les  estimations  simples  de  la  variance 
d'echantillonnage,  qui  sont  peu  couteuses  k  produire,  pour  tenir  compte  de  cet  effet  et 
produire  une  estimation  de  la  variance  d'echantillonnage  pour  n'importe  quelle  estimation 
du  recensement. 

La  racine  carree  de  la  variance  d'echantillonnage,  soit  I'erreur-type,  peut  etre  estimee  k  I'aide 
des  donnees  presentees  dans  les  tableaux  8  et  9.  Le  tableau  8  donne  des  estimations  non 
ajustees  (simples)  de  I'erreur-type  d'estimations-echantillon.  Les  valeurs  pr6sentees  dans 
ce  tableau  ont  ete  etablies  en  supposant  que  la  fraction  de  sondage  etait  de  1/5  dans  un 
echantillon  aieatoire  simple  et  qu'on  avait  utilise  une  ponderation  simple  de  5.  Les  erreurs- 
types  presentees  dans  le  tableau  8  sont  fonction  k  la  fois  de  I'importance  du  "total  estime* 
et  de  la  population  de  la  region.  Par  exemple,  pour  une  estimation  de  250  personnes  dans 
une  region  comptant  1  000  personnes,  I'erreur-type  non  ajustee  est  de  25.  Le  tableau  8 
contient  les  erreurs-types  associees  k  un  nombre  restreint  de  valeurs  du  "total  estime"  et  du 
nombre  total  de  personnes,  de  menages,  de  logements  ou  de  families  dans  la  region.  La 
formule  ci-aprds  peut  etre  utilisee  pour  calculer  I'erreur-type  non  ajustee  de  n'importe  quel 
total  estime,  pour  toute  region,  quelle  qu'en  soit  I'importance: 


^2  Malheureusement ,  la  variance  d'echantillonnage  ne  nous  fournit  aucune 
indication  de  I'importance  de  l'erreur  non  due  a  I'echantillonnage. 


ETNA-. 
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4E(/V-£) 
N        N 


ou  ETNA  est  I'erreur-type  non  ajust6e,  E  le  total  estim§  et  N  le  nombre  total  de  personnes, 
de  manages,  de  logements,  ou  de  families  dans  la  region.  Par  exemple,  pour  un  total  estlm6 
de  750  personnes  dans  une  region  connptant  9  000  personnes,  I'erreur-type  non  ajust6e 
seralt: 


4(750)(9000-750)    g^ 
9000 

Le  tableau  9  contient  les  facteurs  d'ajustement'^  par  lesquels  on  doit  multiplier  les  erreurs- 
types  non  ajust6es  pour  tenir  compte  des  effets  combin6s  du  plan  de  sondage  et  de  la 
m6thode  d'estimation.  Pour  calculer  ces  facteurs  d'ajustement,  un  6chantillon  de  401  RP 
(sur  un  total  de  5  341)  a  6t6  tlr6.  L'6chantillon  a  6t6  r^parti  parmi  les  dix  provinces'"  de 
manidre  k  obtenir  de  bonnes  estimations  de  la  variance  d'6chantillonnage  au  niveau 
provincial  sans  pour  autant  compromettre  indument  la  quality  des  estimations  au  niveau 
national.  Pour  chaque  RP  dans  I'^chantillon,  les  estimations  de  la  variance  d'6chantillonnage 
pour  les  estimations  produites  par  la  MIQ  ont  6t6  calcul6es  pour  diff6rentes  sous-cat6gories 
de  toutes  les  caract6ristiques'*  6num6r6es  dans  le  tableau  9.  Les  estimations  de  la 
variance  d'6chantillonnage  aux  niveaux  provincial  et  national  ont  6t6  obtenues  en  pond6rant 
les  estimations  au  niveau  de  la  RP.  Les  facteurs  d'ajustement  pour  chaque  sous-cat6gorie 
de  chacune  des  caract6ristiques  ont  6t6  calcul6s  en  divisant  la  racine  carr6e  de  ces 
estimations  par  I'erreur-type  non  ajust6e  correspondante.  Des  facteurs  d'ajustement  ont  6t6 
calculus  aux  niveaux  provincial  et  national  pour  chaque  caract6ristique  en  faisant  la  moyenne 
des  facteurs  d'ajustement  de  toutes  les  sous-cat6gories.  Pour  plus  de  renseignements  sur 
la  fagon  dont  ces  facteurs  d'ajustement  ont  6t6  calculus,  voir  B6land  (1990). 

Pour  estimer  I'erreur-type  d'une  estimation-6chantillon  donn6e,  I'utilisateur  doit  se  reporter 
au  tableau  9  pour  obtenir  le  facteur  d'ajustement  s'appliquant  k  la  caract6ristique  en  question 
et  multiplier  ce  facteur  par  I'erreur-type  non  ajust6e  correspondante  dans  le  tableau  8. 
Lorsqu'une  caract6ristique  ne  figure  pas  au  tableau  9,  I'utilisateur  doit  se  servir  du  facteur 
d'ajustement  indiqu6  k  la  categorie  "Autres".  Pour  chaque  caract6ristique  6num6r6e,  le 
tableau  9  fournit  les  facteurs  d'ajustement  applicables  aux  niveaux  national  et  provincial  ainsi 


^^  On  appelle  conununement  "effet  du  plan"  le  carre  des  facteurs 
d'ajustement. 

^*  Le  Yukon  et  les  Territoires  du  Nord-Ouest  ont  ete  groupes  avec  la 
Colombie-Britannique. 

"  Par  exemple,  la  tranche  $15  000  -  $25  000  est  I'une  des  categories  pour 
lesquelles  une  estimation  de  la  variance  d'echantillonnage  a  ete 
calculee  pour  la  caracteristique  "revenu  de  la  famille" . 
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Tableau  8.  Estimations  non  ajust^es  de  i'erreur-type  des  estimations-dchantillon 


Total 
estim^ 


Nombre  total  de  personnes,  m6nages,  logements, 
oCi  families  dans  la  region 


500 


1  000   2  500    5  000  10  000   25  000   50  000   100  000  250  000 


50 

15 

15 

15 

15 

15 

15 

15 

15 

15 

100 

18 

19 

20 

20 

20 

20 

20 

20 

20 

250 

22 

25 

30 

30 

30 

30 

30 

30 

30 

500 

0 

30 

40 

40 

45 

45 

45 

45 

45 

1  000 

0 

50 

55 

60 

60 

65 

65 

65 

2  500 

0 

70 

85 

95 

95 

100 

100 

5  000 

0 

100 

130 

130 

140 

140 

10  000 

0 

150 

180 

190 

200 

25  000 

0 

220 

270 

300 

50  000 

0 

320 

400 

100  000 

0 

490 

250  000 

0 

Total 

Nombre  total  de  personnes,  manages,  logements, 

estim6 

OLi  families  dans  la  region 

500  000 

1  000  000 

2  500  000 

5  000  000 

10  000  000 

25  000  000 

50 

15 

15 

15 

15 

15 

15 

100 

20 

20 

20 

20 

20 

20 

250 

30 

30 

30 

30 

30 

30 

500 

45 

45 

45 

45 

45 

45 

1  000 

65 

65 

65 

65 

65 

65 

2  500 

100 

100 

100 

100 

100 

100 

5  000 

140 

140 

140 

140 

140 

140 

10  000 

200 

200 

200 

200 

200 

200 

25  000 

310 

310 

310 

320 

320 

320 

50  000 

420 

440 

440 

440 

450 

450 

100  000 

570 

600 

620 

630 

630 

630 

250  000 

710 

870 

950 

970 

990 

990 

500  000 

0 

1  000 

1  260 

1  340 

1  380 

1  400 

1  000  000 

0 

1  550 

1  790 

1  900 

1  960 

2  500  000 

0 

2  240 

2  740 

3  000 

5  000  000 

0 

3  160 

4  000 

10  000  000 

0 

4  900 

39- 


Tableau  9.  Facteurs  d'ajustement  de  I'erreur-type  au  niveau  national  ou  provincial  et  centiies  des 
facteurs  au  niveau  de  la  region  de  pond^ration  (RP) 


Caract^ristiques 


Facteur 
national  ou 
provincial  1 


Centiies  des  facteurs  au  niveau  de  la  RP 

50  75  90  95  99        100 


Caract^ristiques  de  la  population 

Age 


Groupes  d'Sge  0-4,  5-9, 

10- 

0.18 

0.05 

14,  15-19,  20-24,  25-29 

Groupes  d'Sge  30-34,  35-44, 

0.36 

0.13 

45-54.  55-59,  60-64,  5  +  , 

15+ 

Grouped'Sge65+ 

0.00 

- 

Sexe 

0.00 

- 

^tat  matrimonial 

C6llbatalre,  marl6 

0.25 

0.04 

(sauf  s6par6(e)) 

S6par6(e),  dlvorc6(e), 

0.88 

0.55 

veuf  (veuve) 

Plus  hiaut  niveau  de  scolarit^  0.90 

atteint/plus  iiaut  grade,  certificat,  ou 
dipldme  obtenu/nombre  total 
d'ann^es  de  scolarit^ 

Principal  domaine  d'^tudes  1 .20 

l\/lobilit6 

N'ayant  pas  d6m6nag6  1.21 

Ayant  d6m6nag6  (migrants.non-    1.61 
migrants) 


P^rlode  d'immigratlon 
Avant  1946.  1946-1966 
1967-1977.  1978-1982, 
1983-1986 

Age  k  rimmigratlon 


0.98 
1.51 


1.10 


0.75 


0.84 


0.83 
0.90 


0.76 
0.80 


0.71 


Lieu  de  naissance 
Au  Canada 
A  r6tranger 

1.09 
1.35 

0.82 
1.11 

Population  immlgrante/non 
immigrante 

1.12 

0.81 

Cltoyennet6 

Du  Canada,  par  naissance 
D'un  autre  pays 

1.13 
1.59 

0.88 
1.04 

0.19  0.29        0.35        0.49        0.52       0.60 

0.33  0.46        0.51         0.56        0.61        0.74 


0.23  0.31         0.42        0.49        0.55        0.68 

0.84  0.98        1.06        1.15         1.20        1.33 

0.95  1.06        1.14        1.19        1.25        1.38 


1.16  1.22        1.28        1.35         1.43        1.51 


1.23  1.27         1.32         1.36         1.41         1.58 

1.60  1.75         1.85         1.97        2.09       2.21 


1.02  1.10        1.22         1.37        1.45        1.62 

1.45  1.55        1.78        1.90        2.11        2.20 


1.15  1.29        1.38        1.44        1.54        1.67 


1.08  1.16        1.18        1.20        1.21        1.33 

1.34  1.43        1.60         1.67        1.75        1.91 

1.10  1.24        1.38        1.46        1.52        1.69 


1.14  1.17        1.20         1.27        1.32        1.58 

1.40  1.65        1.88        1.95        2.12       2.30 
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Tableau  9.  Facteurs  d'ajustement  de  I'erreur-type  au  niveau  national  ou  provincial  et  centiles  des 
facteurs  au  niveau  de  la  region  de  pond6ration  (RP)  -  suite 


Caract^ristiques 


Facteur 
national  ou 
provincial 


Centiles  des  facteurs  au  niveau  de  la  RP 

50  75  90  95  99        100 


Origlne  ethnique 
Frangais,  anglais 
Autres 

1.20 
1.65 

0.73 
1.07 

l^ngue  parlSe  k  la  maison 
Frangais,  anglais,  frangais 
et  anglais,  anglais  et 
autres 

1.12 

0.50 

Autres 

1.76 

0.99 

Langue  officielle 

Frangais,  anglais,  frangais 

et  anglais 

Autres 

1.05 
1.49 

0.69 
0.90 

Langue  maternelle  -  anglais 
Terre-Neuve,  lle-du-Prince- 
^douard,  Nouvelle-^cosse, 

0.92 

0.24 

Colombie-Britannique 
Quebec 

1.15 

0.18 

Autres  provinces 
Canada 

0.45 
0.53 

0.12 

Langue  maternelle  -  frangais 

Qu6bec  0.42  0.14 

Nouveau-Brunswick  0.75  0.19 

Autres  provinces  1 .04  0.09 

Canada  0.77 

Langue  maternelle  -  autre  1 .70  0.73 

Industrie/profession  0.92  0.25 

Travail  en  1985  0.89  0.62 

Semaines  travaill^es  en  1985  0.94  0.68 

Heures  travaill^es  durant  0.83  0.63 
la  semaine  de  rdfdrence 

Date  du  dernier  travail 

En  1986,  en  1985,  avant  0.89  0.60 

1985 

N'a  jamais  travaill^  1.18  0.80 


1.16  1.25  1.31  1.40  1.46       1.65 

1.57  1.70  1.89  1.99         2.11        2.45 


1.09  1.35  1.75  1.89  2.09  2.19 

1.68  1.89  2.01  2.20  2.41  2.66 

1.01  1.18  1.31  1.42  1.58  1.75 

1.50  1.68  1.76  1.79  1.91  2.01 

0.96  1.45  1.62  1.90  2.23  2.45 


1.10  1.51  1.76  1.81  1.99       2.21 

0.48         0.71  0.96  1.12  1.38       1.68 


0.45  0.52 
0.79  0.98 
1.12  1.49 


1.63 
0.80 
0.92 
0.99 
0.85 


2.11 
1.13 
1.14 
1.18 
1.01 


0.94       o.gg 

1.15  1.34 


0.61 
1.24 
1.71 


2.44 
1.25 
1.22 
1.29 
1.14 


0.76 
1.60 
1.89 


2.51 
1.31 
1.29 
1.33 
1.19 


1.05  1.11 

1.43  1.50 


0.91  1.19 
1.84  2.04 
2.06       2.40 


2.60  2.70 

1.38  1.67 
1.31  1.45 

1.39  1.69 
1.24  1.51 

1.20  1.33 

1.67  1.82 
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Tableau  9.  Facteure  d'ajustement  de  Terreur-type  au  niveau  national  ou  provincial  et  centiles  des 
facteure  au  niveau  de  la  region  de  pond6ration  (RP)  -  suite 


Caract^ristiques 


Facteur 
national  ou 
provincial 


Centiles  des  facteurs  au  niveau  de  la  RP 
50  75  90  95  99 


100 


Cat^gorie  de  travailleur 
Travailleur  r6mun6r6 
Travailleur  autonome 
(entreprise  ou  ferme  non 
constitute  en  soci6t6, 
travailleur  familial 
non  rSmun^rS) 

Activity 
Occup6 
En  chomage 
Inactif 

Principal  source  de  revenu 
Salaires  et  traitements 
Autres 

Incapacity 

Limits  k  la  maison,  k 
r^cole,  au  travail 
Pas  limits 

Situation  dans  la  famille 

de  recensement 

^poux,  6pouse,  enfant 
Parent  seul  de  sexe  f6mlnin 
Parent  seul  de  sexe  masculin, 
personne  hors  famille 

Situation  dans  la  famille 
6conomique 

^poux,  6pouse 

Parent  seul,  enfant 

Autres  membres  de  la  famille 

Nombre  de  personnes  dans 
la  famille  de  recensement 

Nombre  de  personnes  dans 
la  famille  6conomique 

Age  de  I'dpoux,  de  I'^pouse, 
ou  de  la  personne  repdre  de  la 
famille  6conomique 

Autres  caract^ristiques 
de  le  population 


0.72 

0.56 

0.75 

0.86 

0.93 

0.95 

0.98 

1.09 

0.93 

0.68 

0.96 

1.08 

1.13 

1.15 

1.18 

1.31 

0.75 

0.59 

0.76 

0.83 

0.86 

0.91 

0.93 

1.04 

1.06 

0.76 

1.04 

1.14 

1.20 

1.27 

1.38 

1.53 

1.25 

0.91 

1.30 

1.43 

,1.50 

1.58 

1.63 

1.84 

0.65 

0.42 

0.67 

0.80 

0.85 

0.87 

0.92 

0.99 

1.05 

0.71 

1.00 

1.12 

1.17 

1.20 

1.24 

1.48 

0.94 

0.69 

0.96 

1.11 

1.29 

1.34 

1.42 

1.69 

0.61 

0.41 

0.58 

0.69 

0.74 

0.78 

0.81 

0.84 

0.20 

0.05 

0.20 

0.24 

0.26 

0.28 

0.31 

0.34 

0.45 

0.14 

0.43 

0.51 

0.55 

0.61 

0.68 

0.81 

0.68 

0.35 

0.65 

0.79 

0.89 

0.99 

1.14 

1.32 

0.14 

0.06 

0.16 

0.21 

0.28 

0.34 

0.36 

0.42 

0.32 

0.16 

0.34 

0.39 

0.44 

0.47 

0.53 

0.68 

0.74 

0.24 

0.70 

0.84 

1.03 

1.09 

1.18 

1.31 

0.04 


0.18 


1.42 


1.00 


0.00 


0.08 


0.80 


0.00 


0.19 


1.37 


0.05 


0.24 


1.53 


0.07 


0.33 


1.60 


0.09 


0.41 


1.78 


0.11        0.13 


0.45       0.71 


1.91        2.08 
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Tableau  9.  Facteurs  d'ajustement  de  I'erreur-type  au  niveau  national  ou  provincial  et  centiles  des 
facteure  au  niveau  de  la  region  de  pond^ration  (RP)  -  suite 


Caract^ristiques 

Facteur 
national  ou 
provincial 

1 

Centiles  des  facteurs  au  niveau  de  la  RP 
50             75             90             95             99 

100 

Caract6ristiques  du  manage  et  du  logement 

Type  de  construction 
Maisons  Individuelles 
App.  dans  un  immeuble 
<  5  6tages 
Autres 

0.33 
0.57 

0.91 

0.05 
0.12 

0.18 

0.35 
0.56 

0.88 

0.55 
0.70 

0.99 

0.67 
0.83 

1.18 

0.75 
0.99 

1.23 

0.89 
1.26 

1.32 

1.08 
1.44 

1.51 

Mode  d'occupation 

0.00 

- 

- 

- 

- 

- 

- 

- 

P6riode  de  construction 

0.78 

0.61 

0.75 

0.82 

0.89 

0.99 

1.24 

1.49 

Systdme  de  chauffage  principal/ 
principal  combustible  pour 
le  ciiauffage 

0.87 

0.18 

0.86 

1.04 

1.12 

1.25 

1.32 

1.47 

Systdme  de  chauffage  central 
Avec  chauffage  central 
Sans  chauffage  central 

0.42 
0.78 

0.09 
0.23 

0.38 
0.79 

0.54 
0.91 

0.60 
1.03 

0.70 
1.12 

0.89 
1.20 

1.19 
1.39 

Taille  du  manage 
Une  personne 
Autres 

0.00 
0.76 

0.19 

0.72 

1.09 

1.17 

1.21 

1.30 

1.53 

Nombre  de  pieces 

0.80 

0.57 

0.78 

0.90 

0.97 

1.10 

1.20 

1.44 

Age  du  soutien  de  manage 
25-34.  55-64,  65-74,  75  + 
0-24,  35-44,  45-54 

0.25 
0.92 

0.06 
0.38 

0.24 
0.90 

0.35 
1.05 

0.48 
1.14 

0.53 
1.21 

0.62 
1.30 

0.94 
1.49 

Sexe  du  soutien  de  manage 
Homme 
Femme 

0.20 
0.47 

0.09 
0.16 

0.24 
0.43 

0.31 
0.54 

0.34 
0.64 

0.36 
0.74 

0.37 
0.89 

0.42 
1.09 

Loyer  brut/pourcentage  du  loyer      0.75 
brut  dans  le  revenu  du  manage 


0.48 


0.79 


0.91 


0.94 


0.96 


1.01 


1.21 


Principales  d^penses  de  proprid-      0.84 
t^/pourcentage  des  principales 
d^penses  de  propri^t^  dans  le 
revenu  du  manage 


0.62 


0.87 


0.95 


1.01 


1.04 


1.11        1.29 


Revenu  du  m6nage 

0.75 

0.51 

0.73 

0.82 

0.90 

0.95 

1.03 

1.17 

Valeur  du  logement 

0.90 

0.67 

0.91 

1.00 

1.05 

1.12 

1.18 

1.32 

Copropri6t6  enregistr6e 
Enregistr6e 
Non  enregistr§e 

0.63 
0.15 

0.18 
0.07 

0.59 
0.14 

0.84 
0.19 

0.93 
0.28 

1.11 
0.39 

1.30 
0.47 

1.48 
0.59 
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Tableau  9.  Facteurs  d'ajustement  de  I'eireur-type  au  niveau  national  ou  provincial  et  centiles  des 
facteurs  au  niveau  de  la  r^ion  de  pond^ration  (RP)  -  suite 


Caract^ristiques 

Facteur 
national  ou 
provincial 

1 

Centiles  des  facteurs  au  niveau  de  la  RP 
50             75            90             95             99 

100 

Genre  de  manage  -  manages 

unifamiliaux 

Sans  "autres  personnes" 
Avec  "autres  personnes" 

0.22 
0.50 

0.05 
0.20 

0.20 
0.48 

0.27 
0.61 

0.33 
0.72 

0.36 
0.74 

0.40 
0.79 

0.56 
0.90 

Genre  de  m6nage  -  m6nages 
non  familiaux 

0.00 

- 

- 

- 

- 

- 

- 

- 

Genre  de  manage  -  autres 

1.12 

0.54 

1.05 

1.26 

1.40 

1.51 

1.67 

1.91 

Autres  caract^ristiques  des 
manages  et  des  logements 

1.00 

- 

- 

- 

- 

- 

- 

- 

Caract^ristiques  de  la  famille 
de  recensement 

Structure  de  la  famille 

^poux-6pouse                            0.20 
Parent  seui  de  sexe  masculin     0.64 
Parent  seui  de  sexe  f6minin        0.46 

0.09 
0.21 
0.19 

0.21 
0.62 
0.45 

0.26 
0.81 
0.57 

0.29 
0.84 
0.65 

0.33 
0.91 
0.69 

0.36 
1.04 
0.74 

0.42 
1.25 
0.91 

Genre  de  famille 
Famille  principale 
Famille  secondaire 

0.23 
0.90 

0.04 
0.62 

0.24 
0.93 

0.28 
1.15 

0.31 
1.28 

0.34 
1.33 

0.39 
1.40 

0.52 
1.49 

Groupes  d'dge  des  enfants 
k  la  maison 


0.78 


0.40 


0.70 


0.91 


0.98 


1.09 


1.19       1.45 


Activity  de  I'^poux,  de  l'6pouse, 

ou  du  parent  seui 
^poux,  parent  seui, 
6poux-6pouse  actifs 


0.40 


0.23 


0.43 


0.50 


0.55 


0.59 


0.71        0.93 


Epouse  active 
Autres 

0.61 
0.72 

0.41 
0.30 

0.60 
0.68 

0.68 
0.80 

0.74 
0.90 

0.78 
0.99 

0.82 
1.12 

1.15 
1.38 

Travail  en  1985  de  I'^poux, 
de  r^pouse,  ou  du  parent  seul 
Atravaill6enl985 
N'a  pas  travaill6  en  1985 

0.48 
0.93 

0.11 
0.60 

0.45 
0.90 

0.50 
1.04 

0.54 
1.18 

0.57 
1.26 

0.59 
1.30 

0.63 
1.43 

Autres  caract^ristiques  de  la 
famille  de  recensement 

1.00 

- 

- 

- 

- 

- 

- 

- 
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Tableau  9.  Facteurs  d'ajustement  de  I'erreur-type  au  niveau  national  ou  provincial  et  centiles  des 
facteurs  au  niveau  de  la  region  de  pond6ration  (RP)  -  fin 

Caract^ristlques  Facteur  Centiles  des  facteurs  au  niveau  de  la  RP 

national  ou 
provincial  1  50  75  90  95  99        100 

Caractdristiques  de 
la  famine  6conomlque 

Structure  de  la  famille  6conomique 

Families  6poux-§pouse  0.29  0.13         0.30         0.36         0.48         0.56         0.68       0.91 

Autres  0.56  0.35         0.50  0.66         0.81  0.90  1.06       1.28 

Langue  maternelle  de  la  personne 
rep^re  de  la  famille:  Anglais 

Terre  Neuve.  lle-du-Prince-  0.25  0.09         0.20         0.31  0.45         0.66         0.91        1.43 

^douard,  Colombie- 

Britannique 


Quebec 

0.49 

0.25 

0.47 

0.50 

0.69 

0.83 

1.05 

1.53 

Autres  provinces 

0.18 

0.07 

0.19 

0.22 

0.24 

0.27 

0.31 

0.49 

Canada 

0.27 

- 

- 

- 

- 

- 

- 

- 

Langue  maternelle  de  la  personne 

repdre  de  la  famille:  Frangais 

Qu6bec 

0.12 

0.04 

0.13 

0.17 

0.21 

0.29 

0.36 

0.51 

Autres  provinces 

0.88 

0.30 

0.90 

1.07 

1.21 

1.28 

1.35 

1.69 

Canada 

0.40 

- 

- 

- 

- 

- 

- 

- 

Langue  maternelle  de  la  personne 

repdre  de  la  famille:  Ni  le  frangais, 

ni  I'anglals 

Ten-e-Neuve,  Nouvelle- 

0.75 

0.38 

0.74 

0.80 

0.91 

0.99 

1.10 

1.38 

^cosse 

Autres  provinces 

0.50 

0.21 

0.45 

0.57 

0.82 

0.84 

0.99 

1.47 

Canada 

0.56 

- 

- 

- 

- 

- 

- 

- 

Autres  caractdristiques  de 

la  famille  ^conomique 

1.00 

- 

- 

- 

- 

- 

- 

- 
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qu'au  niveau  de  la  RP.  A  moins  que  la  region  consid6r6e  ne  soit  plus  petite  que  la  province, 
il  faut  choisir  la  colonne  "Facteur  national  ou  proviricial".  Les  facteurs  d'ajustement  pour  les 
provinces  sont  fournis  uniquement  lorsqu'ils  different  de  fagon  significative  du  facteur 
national.  Cela  s'est  produit  uniquement  dans  le  cas  des  caract§ristiques  relatives  k  la  langue 
maternelle.  Si  un  facteur  d'ajustement  est  requis  pour  une  estimation  se  rapportant  ^  une 
r§gion  plus  petite  qu'une  province,  les  "centiles  des  facteurs  au  niveau  de  la  RP"  permettront 
d'obtenir  une  valeur  plus  precise.  Les  centiles  donnent  l'6tendue  de  tous  les  facteurs 
d'ajustement  au  niveau  des  RP  calculus  dans  I'^tude  pour  les  diff^rentes  sous-cat6gories 
d'une  caract6rlstique.  N%  des  facteurs  d'ajustement  au  niveau  de  la  RP  se  situaient  en- 
dessous  du  H'  centile  et  100  -  N%  se  situaient  au-dessus  du  N'  centile.  Par  exemple,  90% 
des  facteurs  d'ajustement  au  niveau  de  la  RP  6taient  au-dessous  du  90'  centile  et  10%,  au- 
dessus.  On  d6cidera  du  centile  k  utiliser  selon  que  Ton  veut  une  estimation  de  I'erreur-type 
plus  ou  moins  prudente.  Par  exemple,  "100"  nous  donnera  une  estimation  trds  prudente  et 
"75",  une  estimation  qu'il  Test  moins. 

Les  regies  suivantes  doivent  dtre  appliqu6es  pour  calculer  I'erreur-type  ajust6e  : 

(a)  Lorsqu'on  determine  I'erreur-type  d'une  estimation  relative  aux  families  ou  aux  manages, 
il  faut  utiliser  le  nombre  de  families  ou  de  manages  dans  la  region,  pas  le  nombre  de 
personnes,  pour  se  reporter  k  la  colonne  qui  convient  dans  le  tableau  8. 

(b)  A  moins  que  ce  soit  clairement  sp6cifi6  dans  le  tableau  9,  les  caract6ristiques  de  la 
famine  de  recensement  et  de  la  famille  6conomique  impliquant  I'^poux,  I'dpouse,  le 
parent  seul,  ou  la  personne  rep6re  de  la  famille  ont  les  memes  facteurs  d'ajustement  que 
ceux  mentionnes  pour  les  caracteristiques  de  la  population.  Par  exemple,  le  facteur 
d'ajustement  de  la  caract6ristique  "plus  haut  niveau  de  scolarit6  atteint  par  l'6poux, 
r6pouse,  ou  le  parent  seul  de  la  famille  de  recensement"  est  le  meme  que  celul 
mentionn6  pour  la  caract§ristique  de  la  population  "plus  haut  niveau  de  scolarit6  atteint". 

(c)  Pour  le  classement  recoup^  de  deux  ou  plusieurs  caracteristiques,  il  faut  utiliser  le 
facteur  d'ajustement  le  plus  elev6  des  caracteristiques  en  question. 

(d)  Tous  les  facteurs  d'ajustement  ont  6t6  calculus  pour  des  estimations  du  nombre  de 
personnes,  de  manages,  de  logements,  ou  de  families,  et  non  pour,  par  exemple,  des 
unites  comme  les  dollars.  Par  exemple,  les  facteurs  d'ajustement  pour  la  caract6ristique 
"revenu  du  manage"  ont  6t6  calculus  pour  des  estimations  du  nombre  de  manages  ayant 
un  revenu  compris  dans  diff6rentes  categories  telles  5  000  -  14  999  $,  35  000  - 

44  999  $,  etc.,  et  non  pour  des  estimations  tel  le  revenu  moyen  du  manage. 

L'exemple  qui  suit  illustre  la  fapon  de  calculer  I'erreur-type  ajust6e.  Supposons  que 
I'estimation  6tudi6e  est  la  population  immigrante  en  Ontario.  L'estimation  du  recensement 
de  1986  pour  cette  caract6ristique  6tait  2  081  200.  Le  chiffre  de  population  obtenu  pour 
rOntario  au  recensement  de  1986  6tait  9  001  170.  Comme  aucun  des  deux  chiffres  n'est 
tr6s  proche  des  valeurs  donn6es  dans  le  tableau  8,  il  faut  appliquer  la  formule  de  la  page 
37  pour  obtenir  I'erreur-type  non  ajust6e.  Dans  ce  cas-ci,  le  resultat  serait  2  530.  Au  tableau 
9,  on  voit  que  le  facteur  d'ajustement  au  niveau  provincial  pour  la  caract6ristique  "immigrant" 
est  1.12.  II  s'ensuit  que  I'erreur-type  ajust^e  pour  cette  estimation  est  2  530  X  1 .12  =  2  834. 
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L'estimation-6chantillon  et  I'erreur-type  correspondante  peuvent  §tre  utilis6es  pour  construire 
un  intervalle  dans  lequel  on  peut  s'attendre,  avec  un  degr6  de  confiance  donn6,  k  trouver 
la  valeur  inconnue  d'une  caract^ristique  quelconque  de  la  population.  Pour  cette  6tude,  on 
a  pris  un  6chantillon  parmi  un  grand  nombre  possible  d'autres  6chantillons  de  meme  taille 
qu'on  aurait  pu  s^lectionner  k  I'alde  du  mdme  plan  de  sondage.  Les  estimations  obtenues 
^  partir  des  donn^es  recueillies  auprds  des  diff^rents  ^chantillons  ne  seraient  pas  les 
memes.  Si  Ton  construisait  des  intervalles  qui  vont  de  deux  erreurs-types  au-dessous  de 
I'estimation  ^  deux  erreurs-types  au-dessus  de  cette  dernldre,  alors  environ  19  intervalles  sur 
20  comprendraient  la  "vraie"  valeur  qui  aurait  6t6  obtenue  au  moyen  d'un  d^nombrement 
complet.  On  appelle  un  tel  intervalle  un  inten/alle  de  confiance  k  95%  (19/20  =  95%). 
Toutefois,  pour  pouvoir  garantir  un  niveau  de  confiance  de  95%,  les  intervalles  doivent  etre 
calculus  en  utilisant  la  "vraie"  erreur-type  des  estinnations-^chantillon.  Les  erreurs-types 
ajust^es,  qui  sont  calcul^es  ^  partir  des  tableaux  8  et  9,  sont  seulement  des  estimations  des 
"vraies"  erreurs-types.  A  noter  cependant  que  les  estimations-^chantillon  aux  niveaux 
provincial  et  national  devraient  etre  assez  proches  des  vraies  erreurs-types  pour  permettre 
la  construction,  avec  une  precision  raisonnable,  d'intervalles  de  confiance  k  95%.  Au- 
dessous  du  niveau  de  la  province,  I'erreur-type  ajust^e  ne  serait  peut-etre  pas  assez  precise 
pour  permettre  la  construction  d'intervalles  semblables. 

En  prenant  I'erreur-type  calcul6e  ci-dessus,  on  peut  obtenir  un  intervalle  de  confiance  ^ 
environ  95%  pour  le  nombre  d'immigrants  en  Ontario  en  proc6dant  comme  suit: 
2  081  200  ±  2(2  834)  soit  2  081  200  ±  5  668. 
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IX.  CONCLUSION 

L'6chantillonnage  fait  maintenant  partie  int6grante  du  processus  de  recensement.  Son 
utilisation  permet  de  faire  des  Economies  substantlelles  et  de  r6duire  de  fagon  appreciable 
le  fardeau  du  r6pondant,  ou  encore,  d'6largir  la  port6e  d'un  recensement  sans  frais 
suppl6mentaires.  Le  prix  de  ces  avantages  est  une  introduction  d'une  erreur 
d'6chantillonnage  dans  les  estimations  obtenues  ^  partir  de  I'^chantillon.  Get  effet  se  fait 
particuli6rement  sentir  sur  les  estimations  de  faible  valeur  du  recensement,  qu'il  s'agisse  des 
chiffres  se  rapportant  ^  des  categories  peu  usuelles  au  niveau  national  ou  provincial,  ou  de 
ceux  qui  correspondent  k  des  regions  g6ographiques  de  petite  taille.  II  convient  de 
souligner  que  les  erreurs  de  r6ponse  et  les  erreurs  de  d6pouillement  contribuent  6galement 
k  I'erreur  totale  des  estimations  du  recensement  et,  1^  encore,  ce  sont  les  estimations  de 
faible  valeur  qui  sont  particulidrement  sensibles  aux  effets  de  ces  erreurs  non  dues  k 
r^chantillonnage.  De  toute  fagon,  elles  n'auraient  qu'une  fiabilit6  relative  meme  lors  d'un 
recensement  integral.  Pour  ce  qui  est  du  recensement  de  1986,  les  estimations  inf6rieures 
ou  6gales  k  50  6tablies  k  partir  des  donn6es-6chantillon  sont  g6n6ralement  tr6s  peu  fiables 
tandis  que  les  estimations  entre  50  et  500  tendent  k  avoir  des  erreurs-types  de  plus  de  10% 
de  leur  valeur. 

Les  m6thodes  utilis6es  pour  ponderer  les  donn6es-6chantillon  en  vue  d'obtenir  des 
estimations  k  I'^chelle  de  la  population  totale  ont  6t6  appliqu6es  avec  succ6s  et,  de  fagon 
g6n6rale,  ont  permis  d'atteindre  les  niveaux  pr6vus  de  coherence  des  estimations-6chantillon 
et  des  chiffres  de  population.  Toutefois,  la  faible  coherence  au  niveau  des  SD  s'est  av6r6e 
quelque  peu  surprenante  et  ce,  en  d6pit  du  fait  que  les  m6thodes  de  pond6ration  n'avaient 
pas  6t6  congues  pour  controler  la  coh6rence  au  niveau  des  SD.  Une  autre  exception  notable 
a  6t6  le  manque  de  coherence  relativement  aux  r6ponses  multiples  k  la  question  sur  la 
langue  maternelle.  Cette  situation  6tait  apparemment  attribuable  au  fait  que  les  r6pondants 
interpr6taient  la  question  diff6remment  sur  la  formule  2B  que  sur  la  2A.  Les 
estimations-6chantillon  de  plusieurs  autres  caract6ristiques  pr6sentaient  aussi  un  certain 
biais.  II  a  6t6  6tabli  que  ce  biais  avait  6t6  caus6  partiellement  mais  non  enti6rement  par  le 
traitement  des  donn6es,  et  le  Controle  et  I'lmputation.  Le  reste  du  biais  provient  d'un  ou 
plusieurs  facteurs  tels  que  le  biais  de  non-r6ponse,  la  deviation  des  r6ponses,  la  s6lection, 
par  les  recenseurs,  d'un  6chantillon  biais^,  etc.  Les  m6thodes  de  pond6ration  ont  toutefois 
permis  de  corriger  ce  biais  pour  la  plupart  des  caract6ristiques.  Les  estimations-6chantillon 
qui  sont  demeur6es  biais6es  apr6s  la  pond6ration  6taient  celles  qui  se  rapportaient  aux 
caract^ristiques  pour  lesquelles  les  chiffres  de  population  6taient  peu  6lev^s. 

Enfin,  certains  changements  doivent  etre  apport6s  aux  m6thodes  de  pond6ration  pour  le 
recensement  de  1991 .  Les  m6thodes  d'estimation  d6crites  dans  le  present  document  n'ont 
6t6  que  I6g6rement  modifi6es  depuis  leur  creation  en  1971.  Depuis,  I'^laboration  d'autres 
techniques  de  pond6ration  a  beaucoup  progress^.  Les  langages  de  programmation 
disponibles  utilis6s  pour  mettre  en  application  les  algorithmes  de  pond6ration  ont  aussi  6t6 
am6lior6s.  Par  consequent,  en  provision  du  recensement  de  1991,  on  6tudie  actuellement 
des  solutions  de  rechange  k  la  MIQ  et,  selon  les  r6sultats  obtenus,  celles-ci  devraient 
produire  des  estimations  plus  pr6cises.  En  outre,  les  nouvelles  mdthodes  de  pond6ration 
sont  congues  de  fagon  k  am6liorer  la  coherence  des  estimations-6chantillon  et  des  chiffres 
de  population  au  niveau  des  SD.     Ces  ameliorations  devraient  permettre  d'accroitre 
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consid6rablement  la  fiabilit6  des  estimations  sans  pour  autant  augmenter  les  coOts  ou  le 
fardeau  du  rSpondant. 
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ANNEXE 

MATRICES  DE  PONDERATION  A  CLASSEMENT  RECOUPE 

Tableau  Al.  LIgnes  de  la  matrice  de  pond6ration  des  manages,  recensement  de  1986 


Manage 

Soutien  de 
manage 

Nombre  de 

personnes 

dans  le  manage 

Ligne 
no. 

Sexe 

Age 

15-24 

=2 

1 

Homme 

>2 

2 

25-34 

=2 
>2 

3 

4 

Femme 

15-34 

=2 
>2 

5 
6 

M§nages 

35-44 

=2 

7     . 

d'une  ou 
plusieurs 
families 

Homme 

45-54 

>2 

=2 
>2 

8 

9 
10 

55-64 

=2 
>2 

11 
12 

Femme 

35-64 

=2 
>2 

13 
14 

Homme 

^65 

=2 
>2 

15 
16 

Femme 

>65 

17 

Homme 

15-34 

18 

Femme 

15-34 

19 

Manages  non 

familiaux  d'une 

personne 

Homme 

35-64 

20 

Femme 

35-64 

21 

Homme 

>65 

22 

Femme 

S65 

23 

M6nages  non 
familiaux  de  deux 

Homme 

24 

personnes  ou  plus 

Femme 

25 
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Tableau  A2.  Colonnes  de  la  matrice  de  pond^ration  des  manages, 
recensement  de  1986 


McxJe 
d'occupation 

Genre  de 
logement 

Colonne 
no. 

Logements 
Poss6d6s 

Maison 
individuelle 

1 

Autre 

2 

Appartement 

3 

Logements 
lou^s 

Autre 

4 
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Tableau  A3.  Lignes  de  la  matrice  de  pond6ration  des  personnes, 
recensement  de  1986 


Homme 


Femme 


Sexe                 ^tat  ma-                   Age  Ligne 

trimonial  no. 

0-4  1 

5-9  2 

Jamais                   10-14  3 


mari6  15-19  4 

20-24  5 

25-44  6 

45-64  7 

15-24  8 

D6j^  25-34  9 


mari§  35-44  10 

45-54  11 

55-64  12 

>65  13 


0-4  14 

5-9  15 

Jamais  10  - 14  16 


mari6  15-19  17 

20-24  18 

25-44  19 

45-64  20 

15  -  24  21 

D6j^  25  -  34  22 


mari6  35-44  23 

45  -  54  24 

55-64  25 

>65  26 
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Tableau  A4.  Colonnes  de  la  matrice  de  pond^ration  des  personnes, 

recensement  de  1986 


Situation  des  particuiiers  dans  la  familie 

Langue 

Colonne 

maternelle 

no. 

Sans 

Anglais     (A) 

1 

^poux, 

enfant 

Frangais    (F) 

2 

famille 
6poux- 

Autre 

3 

6pouse 

Avec 

A 

4 

enfants 

F 
Autre 

5 
6 

P6re. 

A 

7 

ou  m6re, 

F 

8 

famille 

Autre 

9 

Membres 
de  la 

monoparentale 

Avec 

A 

10 

famille 

Spouse, 

enfants 

F 

11 

famille 
6poux- 

<  6  ans 

Autre 

12 

^pouse 

Sans 

A 

13 

enfant 

F 

14 

<  Bans 

Autre 

15 

0-  14 

A 

16 

ans 

F 

17 

Enfants 
dans  les 

Autre 

18 

families 

>  15 

A 

19 

ans 

F 
Autre 

20 
21 

A 

22 

Personne  1 

F 

23 

Personnes 
hors- 

Autre 

24 

famille 

Autres 

A 

25 

membres 

F 

26 

du 

Autre 

27 

manage 
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